Python Pandas批量读取csv文件到dataframe的方法


Posted in Python onOctober 08, 2018

PYTHON Pandas批量读取csv文件到DATAFRAME

Python Pandas批量读取csv文件到dataframe的方法

首先使用glob.glob获得文件路径。然后定义一个列表,读取文件后再使用concat合并读取到的数据。

#读取数据
import pandas as pd
import numpy as np
import glob,os
path=r'e:\tj\month\fx1806'
file=glob.glob(os.path.join(path, "zq*.xls"))
print(file)
dl= []
for f in file:
 dl.append(pd.read_excel(f,header=[0,1],index_col=None))
df=pd.concat(dl)

下面看下Python使用pandas处理CSV文件的方法

Python中有许多方便的库可以用来进行数据处理,尤其是Numpy和Pandas,再搭配matplot画图专用模块,功能十分强大。

CSV(Comma-Separated Values)格式的文件是指以纯文本形式存储的表格数据,这意味着不能简单的使用Excel表格工具进行处理,而且Excel表格处理的数据量十分有限,而使用Pandas来处理数据量巨大的CSV文件就容易的多了。

我用到的是自己用其他硬件工具抓取得数据,硬件环境是在Linux平台上搭建的,当时数据是在运行脚本后直接输出在terminal里的,数据量十分庞大,为了保存获得的数据,在Linux下使用了数据流重定向,把数据全部保存到了文本文件中,形成了一个本地csv文件。

Pandas读取本地CSV文件并设置Dataframe(数据格式)

import pandas as pd
import numpy as np
df=pd.read_csv('filename',header=None,sep=' ') #filename可以直接从盘符开始,标明每一级的文件夹直到csv文件,header=None表示头部为空,sep=' '表示数据间使用空格作为分隔符,如果分隔符是逗号,只需换成 ‘,'即可。
print df.head()
print df.tail()
#作为示例,输出CSV文件的前5行和最后5行,这是pandas默认的输出5行,可以根据需要自己设定输出几行的值

Python Pandas批量读取csv文件到dataframe的方法

图片中显示了我本地数据的前5行与最后5行,最前面一列没有标号的是行号,数据一共有13列,标号从0到12,一行显示不完全,在第9列以后换了行,并且用反斜杠“\”标注了出来。

2017年4月28日更新

使用pandas直接读取本地的csv文件后,csv文件的列索引默认为从0开始的数字,重定义列索引的语句如下:

import pandas as pd
import numpy as np
df=pd.read_csv('filename',header=None,sep=' ',names=["week",'month','date','time','year','name1','freq1','name2','freq2','name3','data1','name4','data2'])
print df1234

此时打印出的文件信息如下,列索引已经被重命名:

Python Pandas批量读取csv文件到dataframe的方法

总结

以上所述是小编给大家介绍的Python Pandas批量读取csv文件到dataframe的方法,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对三水点靠木网站的支持!

Python 相关文章推荐
Python中用Decorator来简化元编程的教程
Apr 13 Python
深入理解Python中的*重复运算符
Oct 28 Python
python PyTorch参数初始化和Finetune
Feb 11 Python
Python解决两个整数相除只得到整数部分的实例
Nov 10 Python
Python中断多重循环的思路总结
Oct 04 Python
Python笔记之工厂模式
Nov 20 Python
wxPython修改文本框颜色过程解析
Feb 14 Python
Python 给下载文件显示进度条和下载时间的实现
Apr 02 Python
aws 通过boto3 python脚本打pach的实现方法
May 10 Python
将python字符串转化成长表达式的函数eval实例
May 11 Python
详解Python中string模块除去Str还剩下什么
Nov 30 Python
Python 的 sum() Pythonic 的求和方法详细
Oct 16 Python
Python中的函数式编程:不可变的数据结构
Oct 08 #Python
详解多线程Django程序耗尽数据库连接的问题
Oct 08 #Python
JSON文件及Python对JSON文件的读写操作
Oct 07 #Python
Python实现登陆文件验证方法
Oct 06 #Python
python对日志进行处理的实例代码
Oct 06 #Python
浅析Python函数式编程
Oct 06 #Python
Python实现iOS自动化打包详解步骤
Oct 03 #Python
You might like
phpmyadmin的#1251问题
2006/11/25 PHP
php 中的str_replace 函数总结
2007/04/27 PHP
求PHP数组最大值,最小值的代码
2011/10/31 PHP
有关php运算符的知识大全
2011/11/03 PHP
列举PHP的Yii 2框架的开发优势
2015/07/03 PHP
php实现算术验证码功能
2018/12/05 PHP
php常用日期时间函数实例小结
2019/07/04 PHP
thinkphp5框架前后端分离项目实现分页功能的方法分析
2019/10/08 PHP
自己的js工具_Form 封装
2009/08/21 Javascript
jquery 常用操作整理 基础入门篇
2009/10/14 Javascript
javascript正则表达式基础知识入门
2015/04/20 Javascript
AngularJS+Node.js实现在线聊天室
2015/08/28 Javascript
javascript定义类和类的实现实例详解
2015/12/01 Javascript
AngularJS中的Directive自定义一个表格
2016/01/25 Javascript
[原创]JQuery 在表单提交之前修改 提交的值
2016/04/14 Javascript
js 模仿锚点定位的实现方法
2016/11/19 Javascript
jQuery点击导航栏选中更换样式的实现代码
2017/01/23 Javascript
微信小程序实现星级评价
2019/11/20 Javascript
如何使用 vue-cli 创建模板项目
2020/11/19 Vue.js
[40:10]2015国际邀请赛全明星表演赛
2015/08/07 DOTA
深入理解Python 代码优化详解
2014/10/27 Python
讲解Python中的递归函数
2015/04/27 Python
举例讲解Python设计模式编程中的访问者与观察者模式
2016/01/26 Python
python json.dumps中文乱码问题解决
2020/04/01 Python
Django集成MongoDB实现过程解析
2020/12/01 Python
详解HTML5.2版本带来的修改
2020/05/06 HTML / CSS
惠普新加坡官方商店:HP Singapore
2020/04/17 全球购物
师范应届生教师求职信
2013/11/05 职场文书
前台文员岗位职责及工作流程
2013/11/19 职场文书
物流专业自荐信
2014/05/23 职场文书
未受刑事制裁公证证明
2014/09/20 职场文书
2014年实习班主任工作总结
2014/11/08 职场文书
2015年党员岗位承诺书
2015/04/27 职场文书
法人身份证明书
2015/06/18 职场文书
2016年度继续教育学习心得体会
2016/01/19 职场文书
WINDOWS 64位 下安装配置mysql8.0.25最详细的教程
2022/03/22 MySQL