用Python读取几十万行文本数据


Posted in Python onDecember 24, 2018

我在使用python读取几十万行的文件中的数据,并构造字典,列表等数据结构时,再访问字典,列表时,一般都会出现内存不够的问题,然后只能循环读取几百行或者一定数量的行数来循环操作。

keyword_list=[line.strip() for line in open("keywords.txt",'r')]
#f1=open("part_wiki_vec.txt",'r')
f1=open("wiki_vectors.txt")
f2=open("result.txt",'w')
i=0
content=f1.readlines()
while i<1150:
 for line in content[300*i:300*(i+1)]:
  line=line.strip().split(' ')
  if line[0] in keyword_list:
   wordvec=' '.join(line)
   print wordvec
   f2.write(wordvec)
  #print line
 i+=1

我是这样读取的

应该还有很多好的方法,比如多线程等等。

做此记录只为了学习

总结

以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作具有一定的参考学习价值,谢谢大家对三水点靠木的支持。如果你想了解更多相关内容请查看下面相关链接

Python 相关文章推荐
Python使用自带的ConfigParser模块读写ini配置文件
Jun 26 Python
python的pdb调试命令的命令整理及实例
Jul 12 Python
python使用xlrd和xlwt读写Excel文件的实例代码
Sep 05 Python
实例讲解python中的序列化知识点
Oct 08 Python
python批量下载抖音视频
Jun 17 Python
解决Pycharm后台indexing导致不能run的问题
Jun 27 Python
Python实现最大子序和的方法示例
Jul 05 Python
在pytorch中为Module和Tensor指定GPU的例子
Aug 19 Python
python字典setdefault方法和get方法使用实例
Dec 25 Python
使用python将微信image下.dat文件解密为.png的方法
Nov 30 Python
Python中的套接字编程是什么?
Jun 21 Python
FP-growth算法发现频繁项集——构建FP树
Jun 24 Python
python实现flappy bird小游戏
Dec 24 #Python
python实现Flappy Bird源码
Dec 24 #Python
python3安装speech语音模块的方法
Dec 24 #Python
对Python 语音识别框架详解
Dec 24 #Python
python抓取网页内容并进行语音播报的方法
Dec 24 #Python
解决pyttsx3无法封装的问题
Dec 24 #Python
pyttsx3实现中文文字转语音的方法
Dec 24 #Python
You might like
function.inc.php超越php
2006/12/09 PHP
php简单的上传类分享
2016/05/15 PHP
laravel 解决groupBy时出现的错误 isn't in Group By问题
2019/10/17 PHP
html5的自定义data-*属性和jquery的data()方法的使用示例
2013/08/21 Javascript
javascript框架设计读书笔记之数组的扩展与修复
2014/12/02 Javascript
浅谈js中变量初始化
2015/02/03 Javascript
浅析JavaScript中的array数组类型系统
2016/07/18 Javascript
jQuery编写textarea输入字数限制代码
2017/03/23 jQuery
JScript实现表格的简单操作
2017/08/15 Javascript
JavaScript实现换肤功能
2017/09/15 Javascript
加载 vue 远程代码的组件实例详解
2017/11/20 Javascript
如何用RxJS实现Redux Form
2018/12/29 Javascript
JS实现电话号码的字母组合算法示例
2019/02/26 Javascript
vue鼠标悬停事件实例详解
2019/04/01 Javascript
JS实现的雪花飘落特效示例
2019/12/03 Javascript
jQuery 动画与停止动画效果实例详解
2020/05/19 jQuery
vue实现前端分页完整代码
2020/06/17 Javascript
详解微信小程序「渲染层网络层错误」的解决方法
2021/01/06 Javascript
[46:03]LGD vs VGJ.T 2018国际邀请赛小组赛BO2 第一场 8.16
2018/08/17 DOTA
python获取一组数据里最大值max函数用法实例
2015/05/26 Python
Python实现语音识别和语音合成功能
2019/09/20 Python
python十进制转二进制的详解
2020/02/07 Python
Python图像处理库PIL的ImageFilter模块使用介绍
2020/02/26 Python
简单html5代码获取地理位置
2014/03/31 HTML / CSS
美国猫狗药物和用品网站:PetCareRx
2017/01/05 全球购物
毕业设计计划书
2014/01/09 职场文书
高中语文课后反思
2014/04/27 职场文书
运动会宣传口号
2014/06/09 职场文书
党员群众路线对照检查材料
2014/08/31 职场文书
2014年卫生院工作总结
2014/12/03 职场文书
教育实习指导教师评语
2014/12/31 职场文书
服务员岗位职责
2015/02/03 职场文书
教师节感想
2015/08/11 职场文书
2015年幼师个人工作总结
2015/10/15 职场文书
golang 如何用反射reflect操作结构体
2021/04/28 Golang
ORACLE中dbms_output.put_line输出问题的解决过程
2022/06/28 Oracle