Python Pandas批量读取csv文件到dataframe的方法


Posted in Python onOctober 08, 2018

PYTHON Pandas批量读取csv文件到DATAFRAME

Python Pandas批量读取csv文件到dataframe的方法

首先使用glob.glob获得文件路径。然后定义一个列表,读取文件后再使用concat合并读取到的数据。

#读取数据
import pandas as pd
import numpy as np
import glob,os
path=r'e:\tj\month\fx1806'
file=glob.glob(os.path.join(path, "zq*.xls"))
print(file)
dl= []
for f in file:
 dl.append(pd.read_excel(f,header=[0,1],index_col=None))
df=pd.concat(dl)

下面看下Python使用pandas处理CSV文件的方法

Python中有许多方便的库可以用来进行数据处理,尤其是Numpy和Pandas,再搭配matplot画图专用模块,功能十分强大。

CSV(Comma-Separated Values)格式的文件是指以纯文本形式存储的表格数据,这意味着不能简单的使用Excel表格工具进行处理,而且Excel表格处理的数据量十分有限,而使用Pandas来处理数据量巨大的CSV文件就容易的多了。

我用到的是自己用其他硬件工具抓取得数据,硬件环境是在Linux平台上搭建的,当时数据是在运行脚本后直接输出在terminal里的,数据量十分庞大,为了保存获得的数据,在Linux下使用了数据流重定向,把数据全部保存到了文本文件中,形成了一个本地csv文件。

Pandas读取本地CSV文件并设置Dataframe(数据格式)

import pandas as pd
import numpy as np
df=pd.read_csv('filename',header=None,sep=' ') #filename可以直接从盘符开始,标明每一级的文件夹直到csv文件,header=None表示头部为空,sep=' '表示数据间使用空格作为分隔符,如果分隔符是逗号,只需换成 ‘,'即可。
print df.head()
print df.tail()
#作为示例,输出CSV文件的前5行和最后5行,这是pandas默认的输出5行,可以根据需要自己设定输出几行的值

Python Pandas批量读取csv文件到dataframe的方法

图片中显示了我本地数据的前5行与最后5行,最前面一列没有标号的是行号,数据一共有13列,标号从0到12,一行显示不完全,在第9列以后换了行,并且用反斜杠“\”标注了出来。

2017年4月28日更新

使用pandas直接读取本地的csv文件后,csv文件的列索引默认为从0开始的数字,重定义列索引的语句如下:

import pandas as pd
import numpy as np
df=pd.read_csv('filename',header=None,sep=' ',names=["week",'month','date','time','year','name1','freq1','name2','freq2','name3','data1','name4','data2'])
print df1234

此时打印出的文件信息如下,列索引已经被重命名:

Python Pandas批量读取csv文件到dataframe的方法

总结

以上所述是小编给大家介绍的Python Pandas批量读取csv文件到dataframe的方法,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对三水点靠木网站的支持!

Python 相关文章推荐
让python同时兼容python2和python3的8个技巧分享
Jul 11 Python
跟老齐学Python之开始真正编程
Sep 12 Python
九步学会Python装饰器
May 09 Python
Python编程之多态用法实例详解
May 19 Python
python 中split 和 strip的实例详解
Jul 12 Python
python 将字符串完成特定的向右移动方法
Jun 11 Python
python中PS 图像调整算法原理之亮度调整
Jun 28 Python
对Django中的权限和分组管理实例讲解
Aug 16 Python
python图片二值化提高识别率代码实例
Aug 24 Python
python 计算积分图和haar特征的实例代码
Nov 20 Python
你需要学会的8个Python列表技巧
Jun 24 Python
如何使用Python自动生成报表并以邮件发送
Oct 15 Python
Python中的函数式编程:不可变的数据结构
Oct 08 #Python
详解多线程Django程序耗尽数据库连接的问题
Oct 08 #Python
JSON文件及Python对JSON文件的读写操作
Oct 07 #Python
Python实现登陆文件验证方法
Oct 06 #Python
python对日志进行处理的实例代码
Oct 06 #Python
浅析Python函数式编程
Oct 06 #Python
Python实现iOS自动化打包详解步骤
Oct 03 #Python
You might like
PHP 的 __FILE__ 常量
2007/01/15 PHP
PHP中time(),date(),mktime()区别介绍
2013/09/28 PHP
PHP实现抓取迅雷VIP账号的方法
2015/07/30 PHP
利用PHPStorm如何开发Laravel应用详解
2017/08/30 PHP
Javascript模块模式分析
2008/05/16 Javascript
Javascript string 扩展库代码
2010/04/09 Javascript
CSS和Javascript简单复习资料
2010/06/29 Javascript
jquery maxlength使用说明
2011/09/09 Javascript
JS图片根据鼠标滚动延时加载的实例代码
2013/07/13 Javascript
js弹出层永远居中实现思路及代码
2013/11/29 Javascript
详解webpack打包vue时提取css
2017/05/26 Javascript
纯JS实现可用于页码更换的飞页特效示例
2018/05/21 Javascript
Node.js 如何利用异步提升任务处理速度
2019/01/07 Javascript
vuejs中父子组件之间通信方法实例详解
2020/01/17 Javascript
python发腾讯微博代码分享
2014/01/10 Python
解决python写的windows服务不能启动的问题
2014/04/15 Python
Python下载懒人图库JavaScript特效
2015/05/28 Python
浅谈Python中的可变对象和不可变对象
2017/07/07 Python
python如何通过实例方法名字调用方法
2018/03/21 Python
python实现数据分析与建模
2019/07/11 Python
在python中将list分段并保存为array类型的方法
2019/07/15 Python
python的pygal模块绘制反正切函数图像方法
2019/07/16 Python
Python中bisect的使用方法
2019/12/31 Python
Django admin组件的使用
2020/10/24 Python
澳大利亚当地社区首选的光学商店:1001 Optical
2019/08/24 全球购物
群胜软件Java笔试题
2012/09/29 面试题
南京某公司笔试题
2013/01/27 面试题
简历自我评价怎么写好呢?
2014/01/04 职场文书
幼儿园教师培训制度
2014/01/16 职场文书
有关环保的标语
2014/06/13 职场文书
工商局局长个人对照检查材料思想汇报
2014/09/23 职场文书
2015年工商所工作总结
2015/05/21 职场文书
2015年创先争优工作总结
2015/05/23 职场文书
音乐研修感悟
2015/11/18 职场文书
mysql脏页是什么
2021/07/26 MySQL
python index() 与 rindex() 方法的使用示例详解
2022/12/24 Python