用Python读取几十万行文本数据


Posted in Python onDecember 24, 2018

我在使用python读取几十万行的文件中的数据,并构造字典,列表等数据结构时,再访问字典,列表时,一般都会出现内存不够的问题,然后只能循环读取几百行或者一定数量的行数来循环操作。

keyword_list=[line.strip() for line in open("keywords.txt",'r')]
#f1=open("part_wiki_vec.txt",'r')
f1=open("wiki_vectors.txt")
f2=open("result.txt",'w')
i=0
content=f1.readlines()
while i<1150:
 for line in content[300*i:300*(i+1)]:
  line=line.strip().split(' ')
  if line[0] in keyword_list:
   wordvec=' '.join(line)
   print wordvec
   f2.write(wordvec)
  #print line
 i+=1

我是这样读取的

应该还有很多好的方法,比如多线程等等。

做此记录只为了学习

总结

以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作具有一定的参考学习价值,谢谢大家对三水点靠木的支持。如果你想了解更多相关内容请查看下面相关链接

Python 相关文章推荐
python实现2048小游戏
Mar 30 Python
详解python实现读取邮件数据并下载附件的实例
Aug 03 Python
Python3 Random模块代码详解
Dec 04 Python
numpy中索引和切片详解
Dec 15 Python
小米5s微信跳一跳小程序python源码
Jan 08 Python
python程序快速缩进多行代码方法总结
Jun 23 Python
python3 requests库文件上传与下载实现详解
Aug 22 Python
Pycharm中import torch报错的快速解决方法
Mar 05 Python
python中如何进行连乘计算
May 28 Python
python如何停止递归
Sep 09 Python
Python浮点型(float)运算结果不正确的解决方案
Sep 22 Python
Python 阶乘详解
Oct 05 Python
python实现flappy bird小游戏
Dec 24 #Python
python实现Flappy Bird源码
Dec 24 #Python
python3安装speech语音模块的方法
Dec 24 #Python
对Python 语音识别框架详解
Dec 24 #Python
python抓取网页内容并进行语音播报的方法
Dec 24 #Python
解决pyttsx3无法封装的问题
Dec 24 #Python
pyttsx3实现中文文字转语音的方法
Dec 24 #Python
You might like
一周让你学会PHP 不错的学习资料
2009/02/06 PHP
了解Joomla 这款来自国外的php网站管理系统
2010/03/11 PHP
模板引擎正则表达式调试小技巧
2011/07/20 PHP
PHP中shuffle数组值随便排序函数用法
2014/11/21 PHP
php基于协程实现异步的方法分析
2019/07/17 PHP
代码精简的可以实现元素圆角的js函数
2007/07/21 Javascript
来自国外的14个图片放大编辑的jQuery插件整理
2010/10/20 Javascript
JS预览图像将本地图片显示到浏览器上
2013/08/25 Javascript
jQuery的attr与prop使用介绍
2013/10/10 Javascript
JS实现根据当前文字选择返回被选中的文字
2014/05/21 Javascript
js实现点击图片改变页面背景图的方法
2015/02/28 Javascript
js实现简单的左右两边固定广告效果实例
2015/04/10 Javascript
JavaScript中的原始值和复杂值
2016/01/07 Javascript
实例详解jQuery Mockjax 插件模拟 Ajax 请求
2016/01/12 Javascript
jquery实现垂直和水平菜单导航栏
2020/08/27 Javascript
微信小程序 本地存储及登录页面处理实例详解
2017/01/11 Javascript
JavaScript 数组去重并统计重复元素出现的次数实例
2017/12/14 Javascript
JS中常用的消息框总结
2018/02/24 Javascript
Vue三层嵌套路由的示例代码
2018/05/05 Javascript
解决Vue开发中对话框被遮罩层挡住的问题
2018/11/26 Javascript
一文读懂ES7中的javascript修饰器
2019/05/06 Javascript
JavaScript 链表定义与使用方法示例
2020/04/28 Javascript
手把手教你如何编译打包video.js
2020/12/09 Javascript
[02:24]DOTA2痛苦女王 英雄基础教程
2013/11/26 DOTA
[48:53]2014 DOTA2华西杯精英邀请赛 5 25 LGD VS VG第一场
2014/05/26 DOTA
Python 字符串操作实现代码(截取/替换/查找/分割)
2013/06/08 Python
Python标准库之sqlite3使用实例
2014/11/25 Python
在Python的Flask框架下收发电子邮件的教程
2015/04/21 Python
win7 x64系统中安装Scrapy的方法
2018/11/18 Python
如何用C代码给Python写扩展库(Cython)
2019/05/17 Python
解决pycharm中导入自己写的.py函数出错问题
2020/02/12 Python
css3 transform 3d 使用css3创建动态3d立方体(html5实践)
2013/01/06 HTML / CSS
会计师职业生涯规划范文
2014/02/18 职场文书
公司文体活动总结
2015/05/07 职场文书
小学生安全教育主题班会
2015/08/12 职场文书
中国古代史学名著《战国策》概述
2019/08/09 职场文书