用Python读取几十万行文本数据


Posted in Python onDecember 24, 2018

我在使用python读取几十万行的文件中的数据,并构造字典,列表等数据结构时,再访问字典,列表时,一般都会出现内存不够的问题,然后只能循环读取几百行或者一定数量的行数来循环操作。

keyword_list=[line.strip() for line in open("keywords.txt",'r')]
#f1=open("part_wiki_vec.txt",'r')
f1=open("wiki_vectors.txt")
f2=open("result.txt",'w')
i=0
content=f1.readlines()
while i<1150:
 for line in content[300*i:300*(i+1)]:
  line=line.strip().split(' ')
  if line[0] in keyword_list:
   wordvec=' '.join(line)
   print wordvec
   f2.write(wordvec)
  #print line
 i+=1

我是这样读取的

应该还有很多好的方法,比如多线程等等。

做此记录只为了学习

总结

以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作具有一定的参考学习价值,谢谢大家对三水点靠木的支持。如果你想了解更多相关内容请查看下面相关链接

Python 相关文章推荐
举例讲解Python中is和id的用法
Apr 03 Python
python实现将元祖转换成数组的方法
May 04 Python
python好玩的项目—色情图片识别代码分享
Nov 07 Python
python中文乱码不着急,先看懂字节和字符
Dec 20 Python
2018年Python值得关注的开源库、工具和开发者(总结篇)
Jan 04 Python
Python实现字典按key或者value进行排序操作示例【sorted】
May 03 Python
Python3远程监控程序的实现方法
Jul 15 Python
python UDP(udp)协议发送和接收的实例
Jul 22 Python
django2.2安装错误最全的解决方案(小结)
Sep 24 Python
python统计文章中单词出现次数实例
Feb 27 Python
Python socket连接中的粘包、精确传输问题实例分析
Mar 24 Python
Pytorch模型迁移和迁移学习,导入部分模型参数的操作
Mar 03 Python
python实现flappy bird小游戏
Dec 24 #Python
python实现Flappy Bird源码
Dec 24 #Python
python3安装speech语音模块的方法
Dec 24 #Python
对Python 语音识别框架详解
Dec 24 #Python
python抓取网页内容并进行语音播报的方法
Dec 24 #Python
解决pyttsx3无法封装的问题
Dec 24 #Python
pyttsx3实现中文文字转语音的方法
Dec 24 #Python
You might like
php数组函数序列之array_pop() - 删除数组中的最后一个元素
2011/11/07 PHP
深入phpMyAdmin的安装与配置的详细步骤
2013/05/07 PHP
php防止sql注入的方法详解
2017/02/20 PHP
laravel ORM 只开启created_at的几种方法总结
2018/01/29 PHP
针对PHP开发安全问题的相关总结
2019/03/22 PHP
jquery 模式对话框终极版实现代码
2009/09/28 Javascript
jQuery下的动画处理总结
2013/10/10 Javascript
jquery解析xml字符串示例分享
2014/03/25 Javascript
addEventListener 的用法示例介绍
2014/05/07 Javascript
jquery中JSON的解析方式
2015/03/16 Javascript
javascript相关事件的几个概念
2015/05/21 Javascript
JS中的数组方法笔记整理
2016/07/26 Javascript
BootStrap中关于Select下拉框选择触发事件及扩展
2016/11/22 Javascript
jQuery Dialog 打开时自动聚焦的解决方法(两种方法)
2016/11/24 Javascript
简单理解vue中实例属性vm.$els
2016/12/01 Javascript
原生js实现倒计时--2018
2017/02/21 Javascript
微信小程序实现人脸识别
2018/05/25 Javascript
解决vue数组中对象属性变化页面不渲染问题
2018/08/09 Javascript
微信小程序按钮点击跳转页面详解
2019/05/06 Javascript
JQuery样式操作、click事件以及索引值-选项卡应用示例
2019/05/14 jQuery
es6函数之严格模式用法实例分析
2020/03/17 Javascript
Node.js Domain 模块实例详解
2020/03/18 Javascript
Python matplotlib绘图可视化知识点整理(小结)
2018/03/16 Python
Python实现base64编码的图片保存到本地功能示例
2018/06/22 Python
解决Pycharm后台indexing导致不能run的问题
2019/06/27 Python
简单了解python gevent 协程使用及作用
2019/07/22 Python
html5页面结构_动力节点Java学院整理
2017/07/10 HTML / CSS
Hawes & Curtis官网:英国经典品牌
2019/07/27 全球购物
《夏夜多美》教学反思
2014/02/17 职场文书
《蚕姑娘》教学反思
2014/04/15 职场文书
七一党日活动总结
2014/07/08 职场文书
乡镇干部个人对照检查材料(群众路线)
2014/09/26 职场文书
怎样写好工作计划
2019/04/10 职场文书
jQuery实现影院选座订座效果
2021/04/13 jQuery
再次探讨go实现无限 buffer 的 channel方法
2021/06/13 Golang
MySQL插入数据与查询数据
2022/03/25 MySQL