编程 Python

用Python读取几十万行文本数据

Posted in Python onDecember 24, 2018

我在使用python读取几十万行的文件中的数据，并构造字典，列表等数据结构时，再访问字典，列表时，一般都会出现内存不够的问题，然后只能循环读取几百行或者一定数量的行数来循环操作。

keyword_list=[line.strip() for line in open("keywords.txt",'r')]
#f1=open("part_wiki_vec.txt",'r')
f1=open("wiki_vectors.txt")
f2=open("result.txt",'w')
i=0
content=f1.readlines()
while i<1150:
 for line in content[300*i:300*(i+1)]:
  line=line.strip().split(' ')
  if line[0] in keyword_list:
   wordvec=' '.join(line)
   print wordvec
   f2.write(wordvec)
  #print line
 i+=1

我是这样读取的

应该还有很多好的方法，比如多线程等等。

做此记录只为了学习

总结

以上就是这篇文章的全部内容了，希望本文的内容对大家的学习或者工作具有一定的参考学习价值，谢谢大家对三水点靠木的支持。如果你想了解更多相关内容请查看下面相关链接

用Python读取几十万行文本数据

- Author -

accumulate_zhang

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

Python中常用操作字符串的函数与方法总结

Feb 04 Python

使用pandas模块读取csv文件和excel表格,并用matplotlib画图的方法

Jun 22 Python

Python3.6中Twisted模块安装的问题与解决

Apr 15 Python

在win10和linux上分别安装Python虚拟环境的方法步骤

May 09 Python

Django文件上传与下载（FileFlid）

Oct 06 Python

python操作cfg配置文件方式

Dec 22 Python

安装多个版本的TensorFlow的方法步骤

Apr 21 Python

python函数map()和partial()的知识点总结

May 26 Python

如何使用Cython对python代码进行加密

Jul 08 Python

PyChon中关于Jekins的详细安装(推荐)

Dec 28 Python

如何用Django处理gzip数据流

Jan 29 Python

只用20行Python代码实现屏幕录制功能

Jun 02 Python

python实现flappy bird小游戏

Dec 24 #Python

python实现Flappy Bird源码

Dec 24 #Python

python3安装speech语音模块的方法

Dec 24 #Python

对Python 语音识别框架详解

Dec 24 #Python

python抓取网页内容并进行语音播报的方法

Dec 24 #Python

解决pyttsx3无法封装的问题

Dec 24 #Python

pyttsx3实现中文文字转语音的方法

Dec 24 #Python