Python Pandas批量读取csv文件到dataframe的方法


Posted in Python onOctober 08, 2018

PYTHON Pandas批量读取csv文件到DATAFRAME

Python Pandas批量读取csv文件到dataframe的方法

首先使用glob.glob获得文件路径。然后定义一个列表,读取文件后再使用concat合并读取到的数据。

#读取数据
import pandas as pd
import numpy as np
import glob,os
path=r'e:\tj\month\fx1806'
file=glob.glob(os.path.join(path, "zq*.xls"))
print(file)
dl= []
for f in file:
 dl.append(pd.read_excel(f,header=[0,1],index_col=None))
df=pd.concat(dl)

下面看下Python使用pandas处理CSV文件的方法

Python中有许多方便的库可以用来进行数据处理,尤其是Numpy和Pandas,再搭配matplot画图专用模块,功能十分强大。

CSV(Comma-Separated Values)格式的文件是指以纯文本形式存储的表格数据,这意味着不能简单的使用Excel表格工具进行处理,而且Excel表格处理的数据量十分有限,而使用Pandas来处理数据量巨大的CSV文件就容易的多了。

我用到的是自己用其他硬件工具抓取得数据,硬件环境是在Linux平台上搭建的,当时数据是在运行脚本后直接输出在terminal里的,数据量十分庞大,为了保存获得的数据,在Linux下使用了数据流重定向,把数据全部保存到了文本文件中,形成了一个本地csv文件。

Pandas读取本地CSV文件并设置Dataframe(数据格式)

import pandas as pd
import numpy as np
df=pd.read_csv('filename',header=None,sep=' ') #filename可以直接从盘符开始,标明每一级的文件夹直到csv文件,header=None表示头部为空,sep=' '表示数据间使用空格作为分隔符,如果分隔符是逗号,只需换成 ‘,'即可。
print df.head()
print df.tail()
#作为示例,输出CSV文件的前5行和最后5行,这是pandas默认的输出5行,可以根据需要自己设定输出几行的值

Python Pandas批量读取csv文件到dataframe的方法

图片中显示了我本地数据的前5行与最后5行,最前面一列没有标号的是行号,数据一共有13列,标号从0到12,一行显示不完全,在第9列以后换了行,并且用反斜杠“\”标注了出来。

2017年4月28日更新

使用pandas直接读取本地的csv文件后,csv文件的列索引默认为从0开始的数字,重定义列索引的语句如下:

import pandas as pd
import numpy as np
df=pd.read_csv('filename',header=None,sep=' ',names=["week",'month','date','time','year','name1','freq1','name2','freq2','name3','data1','name4','data2'])
print df1234

此时打印出的文件信息如下,列索引已经被重命名:

Python Pandas批量读取csv文件到dataframe的方法

总结

以上所述是小编给大家介绍的Python Pandas批量读取csv文件到dataframe的方法,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对三水点靠木网站的支持!

Python 相关文章推荐
浅析Python中signal包的使用
Nov 13 Python
解决Django模板无法使用perms变量问题的方法
Sep 10 Python
Python 实现淘宝秒杀的示例代码
Jan 02 Python
Python爬虫实现抓取京东店铺信息及下载图片功能示例
Aug 07 Python
Python 实现「食行生鲜」签到领积分功能
Sep 26 Python
Python玩转加密的技巧【推荐】
May 13 Python
基于python实现从尾到头打印链表
Nov 02 Python
django数据模型on_delete, db_constraint的使用详解
Dec 24 Python
Python qrcode 生成一个二维码的实例详解
Feb 12 Python
解决python中显示图片的plt.imshow plt.show()内存泄漏问题
Apr 24 Python
用于ETL的Python数据转换工具详解
Jul 21 Python
python 通过pip freeze、dowload打离线包及自动安装的过程详解(适用于保密的离线环境
Dec 14 Python
Python中的函数式编程:不可变的数据结构
Oct 08 #Python
详解多线程Django程序耗尽数据库连接的问题
Oct 08 #Python
JSON文件及Python对JSON文件的读写操作
Oct 07 #Python
Python实现登陆文件验证方法
Oct 06 #Python
python对日志进行处理的实例代码
Oct 06 #Python
浅析Python函数式编程
Oct 06 #Python
Python实现iOS自动化打包详解步骤
Oct 03 #Python
You might like
ThinkPHP视图查询详解
2014/06/30 PHP
PHP实现的微信APP支付功能示例【基于TP5框架】
2019/09/16 PHP
Javascript实例教程(19) 使用HoTMetal(5)
2006/12/23 Javascript
js一组验证函数
2008/12/20 Javascript
在VS2008中使用jQuery智能感应的方法
2010/12/30 Javascript
关于JavaScript的with 语句的使用方法
2011/05/09 Javascript
JS cookie中文乱码解决方法
2014/01/28 Javascript
wap手机图片滑动切换特效无css3元素js脚本编写
2014/07/28 Javascript
jquery实现相册一下滑动两次的方法
2015/02/09 Javascript
jQuery设置Cookie及删除Cookie实例分析
2016/04/15 Javascript
Angular2环境搭建具体操作步骤(推荐)
2017/08/04 Javascript
JavaScript实现的数字与字符串转换功能示例
2017/08/23 Javascript
深入理解Vue 组件之间传值
2018/08/16 Javascript
解决IE11 vue +webpack 项目中数据更新后页面没有刷新的问题
2018/09/25 Javascript
js实现延迟加载的几种方法详解
2019/01/19 Javascript
JS实现的进制转换,浮点数相加,数字判断操作示例
2019/11/09 Javascript
js DOM的事件常见操作实例详解
2019/12/16 Javascript
python 内置函数filter
2017/06/01 Python
Python for循环中的陷阱详解
2018/07/13 Python
Python http接口自动化测试框架实现方法示例
2018/12/06 Python
python实现中文文本分句的例子
2019/07/15 Python
浅谈Django+Gunicorn+Nginx部署之路
2019/09/11 Python
Python实现中值滤波去噪方式
2019/12/18 Python
python中if及if-else如何使用
2020/06/02 Python
基于python模拟bfs和dfs代码实例
2020/11/19 Python
HTML5中实现拖放效果无须借助javascript
2012/12/26 HTML / CSS
巴西独家产品和现场演示购物网站:Shoptime
2019/07/11 全球购物
美国珠宝精品店:Opulent Jewelers
2019/08/20 全球购物
上海奥佳笔试题面试题
2016/11/16 面试题
大学竞选班干部演讲稿
2014/08/21 职场文书
乡镇党员干部群众路线对照检查材料思想汇报
2014/09/28 职场文书
买房子个人收入证明
2014/10/12 职场文书
开平碉楼导游词
2015/02/06 职场文书
城南旧事读书笔记
2015/06/29 职场文书
CSS3常见动画的实现方式
2021/04/14 HTML / CSS
Python软件包安装的三种常见方法
2022/07/07 Python