用Python读取几十万行文本数据


Posted in Python onDecember 24, 2018

我在使用python读取几十万行的文件中的数据,并构造字典,列表等数据结构时,再访问字典,列表时,一般都会出现内存不够的问题,然后只能循环读取几百行或者一定数量的行数来循环操作。

keyword_list=[line.strip() for line in open("keywords.txt",'r')]
#f1=open("part_wiki_vec.txt",'r')
f1=open("wiki_vectors.txt")
f2=open("result.txt",'w')
i=0
content=f1.readlines()
while i<1150:
 for line in content[300*i:300*(i+1)]:
  line=line.strip().split(' ')
  if line[0] in keyword_list:
   wordvec=' '.join(line)
   print wordvec
   f2.write(wordvec)
  #print line
 i+=1

我是这样读取的

应该还有很多好的方法,比如多线程等等。

做此记录只为了学习

总结

以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作具有一定的参考学习价值,谢谢大家对三水点靠木的支持。如果你想了解更多相关内容请查看下面相关链接

Python 相关文章推荐
Python3读取UTF-8文件及统计文件行数的方法
May 22 Python
分析用Python脚本关闭文件操作的机制
Jun 28 Python
python如何实现excel数据添加到mongodb
Jul 30 Python
浅析Python基础-流程控制
Mar 18 Python
深入浅析Python 中 is 语法带来的误解
May 07 Python
pytorch numpy list类型之间的相互转换实例
Aug 18 Python
Python 实现顺序高斯消元法示例
Dec 09 Python
python入门之基础语法学习笔记
Feb 08 Python
python实现信号时域统计特征提取代码
Feb 26 Python
安装多个版本的TensorFlow的方法步骤
Apr 21 Python
tensorflow使用freeze_graph.py将ckpt转为pb文件的方法
Apr 22 Python
为什么称python为胶水语言
Jun 16 Python
python实现flappy bird小游戏
Dec 24 #Python
python实现Flappy Bird源码
Dec 24 #Python
python3安装speech语音模块的方法
Dec 24 #Python
对Python 语音识别框架详解
Dec 24 #Python
python抓取网页内容并进行语音播报的方法
Dec 24 #Python
解决pyttsx3无法封装的问题
Dec 24 #Python
pyttsx3实现中文文字转语音的方法
Dec 24 #Python
You might like
基于mysql的论坛(4)
2006/10/09 PHP
php中++i 与 i++ 的区别
2012/08/08 PHP
php实现的微信红包算法分析(非官方)
2015/09/25 PHP
PHP编写学校网站上新生注册登陆程序的实例分享
2016/03/21 PHP
php生成酷炫的四个字符验证码
2016/04/22 PHP
Yii2中使用join、joinwith多表关联查询
2016/06/30 PHP
详解cookie验证的php应用的一种SSO解决办法
2017/10/20 PHP
jquery 单引号和双引号的区别及使用注意
2013/07/31 Javascript
使用jQuery异步加载 JavaScript脚本解决方案
2014/04/20 Javascript
JS实现alert中显示换行的方法
2015/12/17 Javascript
基于Vue.js的表格分页组件
2016/05/22 Javascript
jQuery 限制输入字符串长度
2016/06/20 Javascript
基于jQuery实现页面搜索功能
2020/03/26 Javascript
Form表单上传文件(type=&quot;file&quot;)的使用
2017/08/03 Javascript
对Vue- 动态元素属性及v-bind和v-model的区别详解
2018/08/27 Javascript
Mint UI组件库CheckList使用及踩坑总结
2018/12/20 Javascript
小程序自定义模板实现吸顶功能
2020/01/08 Javascript
vue实现单一筛选、删除筛选条件
2020/10/26 Javascript
解决Element中el-date-picker组件不回填的情况
2020/11/07 Javascript
如何实现vue的tree组件
2020/12/03 Vue.js
[01:20:30]OG vs LGD 2018国际邀请赛淘汰赛BO3 第四场 8.26
2018/08/30 DOTA
python使用百度翻译进行中翻英示例
2014/04/14 Python
Python简单进程锁代码实例
2015/04/27 Python
python自动查询12306余票并发送邮箱提醒脚本
2018/05/21 Python
pandas dataframe添加表格框线输出的方法
2019/02/08 Python
python aiohttp的使用详解
2019/06/20 Python
python 解决tqdm模块不能单行显示的问题
2020/02/19 Python
Python ADF 单位根检验 如何查看结果的实现
2020/06/03 Python
学习Python爬虫的几点建议
2020/08/05 Python
怎样写好自荐信和推荐信
2013/12/26 职场文书
个人查摆问题及整改措施
2014/10/16 职场文书
新郎婚礼答谢词
2015/01/04 职场文书
2019广播稿怎么写
2019/04/17 职场文书
学长教您写论文:经验总结
2019/07/09 职场文书
Nginx反向代理至go-fastdfs案例讲解
2021/08/02 Servers
Golang解析JSON对象
2022/04/30 Golang