Python Pandas批量读取csv文件到dataframe的方法


Posted in Python onOctober 08, 2018

PYTHON Pandas批量读取csv文件到DATAFRAME

Python Pandas批量读取csv文件到dataframe的方法

首先使用glob.glob获得文件路径。然后定义一个列表,读取文件后再使用concat合并读取到的数据。

#读取数据
import pandas as pd
import numpy as np
import glob,os
path=r'e:\tj\month\fx1806'
file=glob.glob(os.path.join(path, "zq*.xls"))
print(file)
dl= []
for f in file:
 dl.append(pd.read_excel(f,header=[0,1],index_col=None))
df=pd.concat(dl)

下面看下Python使用pandas处理CSV文件的方法

Python中有许多方便的库可以用来进行数据处理,尤其是Numpy和Pandas,再搭配matplot画图专用模块,功能十分强大。

CSV(Comma-Separated Values)格式的文件是指以纯文本形式存储的表格数据,这意味着不能简单的使用Excel表格工具进行处理,而且Excel表格处理的数据量十分有限,而使用Pandas来处理数据量巨大的CSV文件就容易的多了。

我用到的是自己用其他硬件工具抓取得数据,硬件环境是在Linux平台上搭建的,当时数据是在运行脚本后直接输出在terminal里的,数据量十分庞大,为了保存获得的数据,在Linux下使用了数据流重定向,把数据全部保存到了文本文件中,形成了一个本地csv文件。

Pandas读取本地CSV文件并设置Dataframe(数据格式)

import pandas as pd
import numpy as np
df=pd.read_csv('filename',header=None,sep=' ') #filename可以直接从盘符开始,标明每一级的文件夹直到csv文件,header=None表示头部为空,sep=' '表示数据间使用空格作为分隔符,如果分隔符是逗号,只需换成 ‘,'即可。
print df.head()
print df.tail()
#作为示例,输出CSV文件的前5行和最后5行,这是pandas默认的输出5行,可以根据需要自己设定输出几行的值

Python Pandas批量读取csv文件到dataframe的方法

图片中显示了我本地数据的前5行与最后5行,最前面一列没有标号的是行号,数据一共有13列,标号从0到12,一行显示不完全,在第9列以后换了行,并且用反斜杠“\”标注了出来。

2017年4月28日更新

使用pandas直接读取本地的csv文件后,csv文件的列索引默认为从0开始的数字,重定义列索引的语句如下:

import pandas as pd
import numpy as np
df=pd.read_csv('filename',header=None,sep=' ',names=["week",'month','date','time','year','name1','freq1','name2','freq2','name3','data1','name4','data2'])
print df1234

此时打印出的文件信息如下,列索引已经被重命名:

Python Pandas批量读取csv文件到dataframe的方法

总结

以上所述是小编给大家介绍的Python Pandas批量读取csv文件到dataframe的方法,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对三水点靠木网站的支持!

Python 相关文章推荐
简单谈谈Python中函数的可变参数
Sep 02 Python
Python中二维列表如何获取子区域元素的组成
Jan 19 Python
Python实现一个Git日志统计分析的小工具
Dec 14 Python
python 中if else 语句的作用及示例代码
Mar 05 Python
pycharm显示远程图片的实现
Nov 04 Python
Pytorch 实现冻结指定卷积层的参数
Jan 06 Python
使用tensorflow DataSet实现高效加载变长文本输入
Jan 20 Python
python 利用opencv实现图像网络传输
Nov 12 Python
Pyqt助手安装PyQt5帮助文档过程图解
Nov 20 Python
python爬虫中url管理器去重操作实例
Nov 30 Python
Python利器openpyxl之操作excel表格
Apr 17 Python
浏览器常用基本操作之python3+selenium4自动化测试(基础篇3)
May 21 Python
Python中的函数式编程:不可变的数据结构
Oct 08 #Python
详解多线程Django程序耗尽数据库连接的问题
Oct 08 #Python
JSON文件及Python对JSON文件的读写操作
Oct 07 #Python
Python实现登陆文件验证方法
Oct 06 #Python
python对日志进行处理的实例代码
Oct 06 #Python
浅析Python函数式编程
Oct 06 #Python
Python实现iOS自动化打包详解步骤
Oct 03 #Python
You might like
解析php file_exists无效的解决办法
2013/06/26 PHP
PHP连接MySQL数据的操作要点
2015/03/20 PHP
jquery ajax修改全局变量示例代码
2013/11/08 Javascript
JavaScript类属性的访问方式详解
2014/02/11 Javascript
jQuery获得IE版本不准确webbrowser的解决方法
2014/02/23 Javascript
JS获取随机数函数可自定义最小值最大值
2014/05/08 Javascript
javascript适合移动端的日期时间拾取器
2015/11/10 Javascript
基于jQuery实现表格的查看修改删除
2016/08/01 Javascript
jQuery可见性过滤选择器用法示例
2016/09/09 Javascript
原生JavaScript制作计算器
2016/10/16 Javascript
JS求解三元一次方程组值的方法
2017/01/03 Javascript
Angular组件化管理实现方法分析
2017/03/17 Javascript
微信小程序实战之自定义模态弹窗(8)
2017/04/18 Javascript
jQuery实现选中行变色效果(实例讲解)
2017/07/06 jQuery
解决webpack打包速度慢的解决办法汇总
2017/07/06 Javascript
VUE element-ui 写个复用Table组件的示例代码
2017/11/18 Javascript
vue指令之表单控件绑定v-model v-model与v-bind结合使用
2019/04/17 Javascript
微信小程序Flex布局用法深入浅出分析
2019/04/25 Javascript
webpack-mvc 传统多页面组件化开发详解
2019/05/07 Javascript
Python设计模式之抽象工厂模式
2016/08/25 Python
django静态文件加载的方法
2018/05/20 Python
Python修改文件往指定行插入内容的实例
2019/01/30 Python
详解pyinstaller selenium python3 chrome打包问题
2019/10/18 Python
python3使用Pillow、tesseract-ocr与pytesseract模块的图片识别的方法
2020/02/26 Python
python实现用户名密码校验
2020/03/18 Python
PyQt5实现登录页面
2020/05/30 Python
Python3+PyCharm+Django+Django REST framework配置与简单开发教程
2021/02/16 Python
世嘉游戏英国官方商店:SEGA Shop UK
2019/09/20 全球购物
怎么处理XML的中文问题
2015/03/26 面试题
Linux机考试题
2015/10/16 面试题
什么是JNDI的上下文?如何初始化JNDI上下文
2012/03/10 面试题
kfc实习自我鉴定
2013/12/14 职场文书
创先争优制度
2014/01/21 职场文书
说明书格式及范文
2014/05/07 职场文书
2014年建筑工作总结
2014/11/26 职场文书
大学迎新生欢迎词
2015/09/29 职场文书