python批量读取txt文件为DataFrame的方法


Posted in Python onApril 03, 2018

我们有时候会批量处理同一个文件夹下的文件,并且希望读取到一个文件里面便于我们计算操作。比方我有下图一系列的txt文件,我该如何把它们写入一个txt文件中并且读取为DataFrame格式呢?

python批量读取txt文件为DataFrame的方法

首先我们要用到glob模块,这个python内置的模块可以说是非常的好用。

glob.glob('*.txt')

得到如下结果:

python批量读取txt文件为DataFrame的方法

all.txt是我最后得到的结果文件。可以见返回的是一个包含txt文件名称的列表,当然如果你的文件夹下面只有txt文件,那么你用os.listdir()可以得到一个一样的列表

然后读取的时候只要注意txt文件的编码格式(可以用notepad++打开记事本查看)和间隔符的形式就好了,完整的代码如下:

import os
import pandas
import codecs
import glob
import pandas as pd
os.getcwd()
os.chdir('D:\AAAASXQ\python study\data preprocessing')
def txtcombine():
 
 files = glob.glob('*.txt')
 
 all = codecs.open('all.txt','a')
 
 for filename in flist: 
 print(filename) 
 fopen=codecs.open(filename,'r',encoding='utf-8') 
 lines=[] 
 lines=fopen.readlines() 
 fopen.close() 
 i=0 
 for line in lines: 
  for x in line: 
  all.write(x)
 #读取为DataFrame格式
 all1 = pd.read_csv('all.txt',sep=' ',encoding='GB2312')
 #保存为csv格式
 all1.to_csv('all.csv',encoding='GB2312')
 
if __name__ == '__main__': 
 txtcombine()

以上这篇python批量读取txt文件为DataFrame的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python脚本实现代码行数统计代码分享
Mar 10 Python
使用Python的内建模块collections的教程
Apr 28 Python
Python中random模块生成随机数详解
Mar 10 Python
使用python进行拆分大文件的方法
Dec 10 Python
在Python中合并字典模块ChainMap的隐藏坑【推荐】
Jun 27 Python
解决pycharm 工具栏Tool中找不到Run manager.py Task的问题
Jul 01 Python
Django使用消息提示简单的弹出个对话框实例
Nov 15 Python
selenium+Chrome滑动验证码破解二(某某网站)
Dec 17 Python
关于Tensorflow分布式并行策略
Feb 03 Python
找Python安装目录,设置环境路径以及在命令行运行python脚本实例
Mar 09 Python
Python实现日志实时监测的示例详解
Apr 06 Python
如何使用python包中的sched事件调度器
Apr 30 Python
python逐行读写txt文件的实例讲解
Apr 03 #Python
Python实现的计算马氏距离算法示例
Apr 03 #Python
python2.7无法使用pip的解决方法(安装easy_install)
Apr 03 #Python
快速解决安装python没有scripts文件夹的问题
Apr 03 #Python
Python中将变量按行写入txt文本中的方法
Apr 03 #Python
python使用tensorflow深度学习识别验证码
Apr 03 #Python
使用python获取csv文本的某行或某列数据的实例
Apr 03 #Python
You might like
搜索和替换文件或目录的一个好类--很实用
2006/10/09 PHP
php下使用无限生命期Session的方法
2007/03/16 PHP
php+Ajax处理xml与json格式数据的方法示例
2019/03/04 PHP
jQuery学习笔记之DOM对象和jQuery对象
2010/12/22 Javascript
JQUERY 设置SELECT选中项代码
2014/02/07 Javascript
同一个网页中实现多个JavaScript特效的方法
2015/02/02 Javascript
jQuery实现冻结表头的方法
2015/03/09 Javascript
JS实现选择TextArea内文本的方法
2015/08/03 Javascript
JavaScript html5 canvas画布中删除一个块区域的方法
2016/01/26 Javascript
原生JS封装ajax 传json,str,excel文件上传提交表单(推荐)
2016/06/21 Javascript
js删除局部变量的实现方法
2016/06/25 Javascript
JavaScript比较当前时间是否在指定时间段内的方法
2016/08/02 Javascript
jquery 属性选择器(匹配具有指定属性的元素)
2016/09/06 Javascript
解决循环中setTimeout执行顺序的问题
2018/06/20 Javascript
使用vue根据状态添加列表数据和删除列表数据的实例
2018/09/29 Javascript
vue通过cookie获取用户登录信息的思路详解
2018/10/30 Javascript
jQuery-ui插件sortable实现自由拖动排序
2018/12/01 jQuery
Javascript查看大图功能代码实现
2020/05/07 Javascript
浅谈Vue static 静态资源路径 和 style问题
2020/11/07 Javascript
使用SAE部署Python运行环境的教程
2015/05/05 Python
Python黑魔法@property装饰器的使用技巧解析
2016/06/16 Python
flask-socketio实现WebSocket的方法
2018/07/31 Python
python opencv读mp4视频的实例
2018/12/07 Python
python浪漫表白源码
2019/04/05 Python
PyQt4实时显示文本内容GUI的示例
2019/06/14 Python
Python使用socket模块实现简单tcp通信
2020/08/18 Python
洛杉矶时尚女装系列:J.ING US
2019/03/17 全球购物
C语言编程题
2015/03/09 面试题
聚美优品的广告词
2014/03/14 职场文书
个人工作表现评语
2014/04/30 职场文书
2014年教师节讲话稿5篇
2014/09/10 职场文书
王兆力在市委党的群众路线教育实践活动总结大会上的讲话稿
2014/10/25 职场文书
2014年信贷员工作总结
2014/11/18 职场文书
人民币使用说明书
2019/04/17 职场文书
《岳阳楼记》原文、译文赏析
2019/09/10 职场文书
Pytorch 中net.train 和 net.eval的使用说明
2021/05/22 Python