Python Pandas批量读取csv文件到dataframe的方法


Posted in Python onOctober 08, 2018

PYTHON Pandas批量读取csv文件到DATAFRAME

Python Pandas批量读取csv文件到dataframe的方法

首先使用glob.glob获得文件路径。然后定义一个列表,读取文件后再使用concat合并读取到的数据。

#读取数据
import pandas as pd
import numpy as np
import glob,os
path=r'e:\tj\month\fx1806'
file=glob.glob(os.path.join(path, "zq*.xls"))
print(file)
dl= []
for f in file:
 dl.append(pd.read_excel(f,header=[0,1],index_col=None))
df=pd.concat(dl)

下面看下Python使用pandas处理CSV文件的方法

Python中有许多方便的库可以用来进行数据处理,尤其是Numpy和Pandas,再搭配matplot画图专用模块,功能十分强大。

CSV(Comma-Separated Values)格式的文件是指以纯文本形式存储的表格数据,这意味着不能简单的使用Excel表格工具进行处理,而且Excel表格处理的数据量十分有限,而使用Pandas来处理数据量巨大的CSV文件就容易的多了。

我用到的是自己用其他硬件工具抓取得数据,硬件环境是在Linux平台上搭建的,当时数据是在运行脚本后直接输出在terminal里的,数据量十分庞大,为了保存获得的数据,在Linux下使用了数据流重定向,把数据全部保存到了文本文件中,形成了一个本地csv文件。

Pandas读取本地CSV文件并设置Dataframe(数据格式)

import pandas as pd
import numpy as np
df=pd.read_csv('filename',header=None,sep=' ') #filename可以直接从盘符开始,标明每一级的文件夹直到csv文件,header=None表示头部为空,sep=' '表示数据间使用空格作为分隔符,如果分隔符是逗号,只需换成 ‘,'即可。
print df.head()
print df.tail()
#作为示例,输出CSV文件的前5行和最后5行,这是pandas默认的输出5行,可以根据需要自己设定输出几行的值

Python Pandas批量读取csv文件到dataframe的方法

图片中显示了我本地数据的前5行与最后5行,最前面一列没有标号的是行号,数据一共有13列,标号从0到12,一行显示不完全,在第9列以后换了行,并且用反斜杠“\”标注了出来。

2017年4月28日更新

使用pandas直接读取本地的csv文件后,csv文件的列索引默认为从0开始的数字,重定义列索引的语句如下:

import pandas as pd
import numpy as np
df=pd.read_csv('filename',header=None,sep=' ',names=["week",'month','date','time','year','name1','freq1','name2','freq2','name3','data1','name4','data2'])
print df1234

此时打印出的文件信息如下,列索引已经被重命名:

Python Pandas批量读取csv文件到dataframe的方法

总结

以上所述是小编给大家介绍的Python Pandas批量读取csv文件到dataframe的方法,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对三水点靠木网站的支持!

Python 相关文章推荐
Python安装Imaging报错:The _imaging C module is not installed问题解决方法
Aug 22 Python
Python使用MD5加密字符串示例
Aug 22 Python
Python 类的继承实例详解
Mar 25 Python
import的本质解析
Oct 30 Python
Python3最长回文子串算法示例
Mar 04 Python
python itchat给指定联系人发消息的方法
Jun 11 Python
Python实现将蓝底照片转化为白底照片功能完整实例
Dec 13 Python
简单了解Python变量作用域正确使用方法
Jun 12 Python
pycharm导入源码的具体步骤
Aug 04 Python
Python实现EM算法实例代码
Oct 04 Python
Python安装Bs4的多种方法
Nov 28 Python
pytorch通过训练结果的复现设置随机种子
Jun 01 Python
Python中的函数式编程:不可变的数据结构
Oct 08 #Python
详解多线程Django程序耗尽数据库连接的问题
Oct 08 #Python
JSON文件及Python对JSON文件的读写操作
Oct 07 #Python
Python实现登陆文件验证方法
Oct 06 #Python
python对日志进行处理的实例代码
Oct 06 #Python
浅析Python函数式编程
Oct 06 #Python
Python实现iOS自动化打包详解步骤
Oct 03 #Python
You might like
《魔兽争霸3:重制版》翻车了?你想要的我们都没有
2019/11/07 魔兽争霸
ThinkPHP关联模型操作实例分析
2012/09/23 PHP
ajax取消挂起请求的处理方法
2013/03/18 PHP
destoon二次开发常用数据库操作
2014/06/21 PHP
php实现的xml操作类
2016/01/15 PHP
PHP面向对象程序设计之对象生成方法详解
2016/12/02 PHP
用javascript实现在小方框中浏览大图的代码
2007/08/14 Javascript
js函数般调用正则
2008/04/08 Javascript
js post方式传递提交的实现代码
2010/05/31 Javascript
jQuery UI Dialog控件中的表单无法正常提交的解决方法
2010/12/19 Javascript
基于jquery的loading 加载提示效果实现代码
2011/09/01 Javascript
js控制的回到页面顶端goTop的代码实现
2013/03/20 Javascript
JS实现字体选色板实例代码
2013/11/20 Javascript
讲解JavaScript中for...in语句的使用方法
2015/06/03 Javascript
JavaScript设计模式之单体模式全面解析
2016/09/09 Javascript
清除js缓存的多种方法总结
2016/12/09 Javascript
微信小游戏中three.js离屏画布的示例代码
2020/10/12 Javascript
Python实现同时兼容老版和新版Socket协议的一个简单WebSocket服务器
2014/06/04 Python
介绍Python的@property装饰器的用法
2015/04/28 Python
Python装饰器用法实例总结
2018/05/26 Python
Python3随机漫步生成数据并绘制
2018/08/27 Python
python程序封装为win32服务的方法
2021/03/07 Python
Ubuntu18.04下python版本完美切换的解决方法
2019/06/14 Python
python Pandas如何对数据集随机抽样
2019/07/29 Python
用python画一只可爱的皮卡丘实例
2019/11/21 Python
Python关键字及可变参数*args,**kw原理解析
2020/04/04 Python
一组SQL面试题
2016/02/15 面试题
小学先进集体事迹材料
2014/05/31 职场文书
绿色环保标语
2014/06/12 职场文书
物联网工程专业推荐信
2014/09/08 职场文书
仲裁协议书
2014/09/26 职场文书
工资收入证明
2014/10/07 职场文书
2014年小学体育工作总结
2014/12/11 职场文书
2015年大班保育员工作总结
2015/05/18 职场文书
运动会广播稿50字
2015/08/19 职场文书
Python OpenCV实现图形检测示例详解
2022/04/08 Python