Python Pandas批量读取csv文件到dataframe的方法


Posted in Python onOctober 08, 2018

PYTHON Pandas批量读取csv文件到DATAFRAME

Python Pandas批量读取csv文件到dataframe的方法

首先使用glob.glob获得文件路径。然后定义一个列表,读取文件后再使用concat合并读取到的数据。

#读取数据
import pandas as pd
import numpy as np
import glob,os
path=r'e:\tj\month\fx1806'
file=glob.glob(os.path.join(path, "zq*.xls"))
print(file)
dl= []
for f in file:
 dl.append(pd.read_excel(f,header=[0,1],index_col=None))
df=pd.concat(dl)

下面看下Python使用pandas处理CSV文件的方法

Python中有许多方便的库可以用来进行数据处理,尤其是Numpy和Pandas,再搭配matplot画图专用模块,功能十分强大。

CSV(Comma-Separated Values)格式的文件是指以纯文本形式存储的表格数据,这意味着不能简单的使用Excel表格工具进行处理,而且Excel表格处理的数据量十分有限,而使用Pandas来处理数据量巨大的CSV文件就容易的多了。

我用到的是自己用其他硬件工具抓取得数据,硬件环境是在Linux平台上搭建的,当时数据是在运行脚本后直接输出在terminal里的,数据量十分庞大,为了保存获得的数据,在Linux下使用了数据流重定向,把数据全部保存到了文本文件中,形成了一个本地csv文件。

Pandas读取本地CSV文件并设置Dataframe(数据格式)

import pandas as pd
import numpy as np
df=pd.read_csv('filename',header=None,sep=' ') #filename可以直接从盘符开始,标明每一级的文件夹直到csv文件,header=None表示头部为空,sep=' '表示数据间使用空格作为分隔符,如果分隔符是逗号,只需换成 ‘,'即可。
print df.head()
print df.tail()
#作为示例,输出CSV文件的前5行和最后5行,这是pandas默认的输出5行,可以根据需要自己设定输出几行的值

Python Pandas批量读取csv文件到dataframe的方法

图片中显示了我本地数据的前5行与最后5行,最前面一列没有标号的是行号,数据一共有13列,标号从0到12,一行显示不完全,在第9列以后换了行,并且用反斜杠“\”标注了出来。

2017年4月28日更新

使用pandas直接读取本地的csv文件后,csv文件的列索引默认为从0开始的数字,重定义列索引的语句如下:

import pandas as pd
import numpy as np
df=pd.read_csv('filename',header=None,sep=' ',names=["week",'month','date','time','year','name1','freq1','name2','freq2','name3','data1','name4','data2'])
print df1234

此时打印出的文件信息如下,列索引已经被重命名:

Python Pandas批量读取csv文件到dataframe的方法

总结

以上所述是小编给大家介绍的Python Pandas批量读取csv文件到dataframe的方法,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对三水点靠木网站的支持!

Python 相关文章推荐
使用Python脚本和ADB命令实现卸载App
Feb 10 Python
Python面向对象特殊成员
Apr 24 Python
Python 常用的安装Module方式汇总
May 06 Python
Windows下的Python 3.6.1的下载与安装图文详解(适合32位和64位)
Feb 21 Python
python爬虫之xpath的基本使用详解
Apr 18 Python
Python实现的根据IP地址计算子网掩码位数功能示例
May 23 Python
python如何制作英文字典
Jun 25 Python
python读写csv文件方法详细总结
Jul 05 Python
如何基于Python创建目录文件夹
Dec 31 Python
简单了解python filter、map、reduce的区别
Jan 14 Python
Python描述符descriptor使用原理解析
Mar 21 Python
python输出数学符号实例
May 11 Python
Python中的函数式编程:不可变的数据结构
Oct 08 #Python
详解多线程Django程序耗尽数据库连接的问题
Oct 08 #Python
JSON文件及Python对JSON文件的读写操作
Oct 07 #Python
Python实现登陆文件验证方法
Oct 06 #Python
python对日志进行处理的实例代码
Oct 06 #Python
浅析Python函数式编程
Oct 06 #Python
Python实现iOS自动化打包详解步骤
Oct 03 #Python
You might like
什么是短波收听SWL
2021/03/01 无线电
php 数组的一个悲剧?
2011/05/11 PHP
PHP缓存工具XCache安装与使用方法详解
2018/04/09 PHP
解决Laravel 使用insert插入数据,字段created_at为0000的问题
2019/10/11 PHP
Javascript实现CheckBox的全选与取消全选的代码
2010/07/20 Javascript
js 字符串转化成数字的代码
2011/06/29 Javascript
各种常用的JS函数整理
2013/10/25 Javascript
js类式继承的具体实现方法
2013/12/31 Javascript
使用jquery实现的一个图片延迟加载插件(含图片延迟加载原理)
2014/06/05 Javascript
node.js中的fs.open方法使用说明
2014/12/17 Javascript
Javascript 运动中Offset的bug解决方案
2014/12/24 Javascript
javascript实现滑动解锁功能
2014/12/31 Javascript
浅谈JavaScript中的对象及Promise对象的实现
2015/11/15 Javascript
基于javascript实现精确到毫秒的倒计时限时抢购
2016/04/17 Javascript
html+js实现简单的计算器代码(加减乘除)
2016/07/12 Javascript
浅析Node.js:DNS模块的使用
2016/11/23 Javascript
JavaScript组成、引入、输出、运算符基础知识讲解
2016/12/08 Javascript
bootstrap suggest搜索建议插件使用详解
2017/03/25 Javascript
Angular 4.x中表单Reactive Forms详解
2017/04/25 Javascript
高性能的javascript之加载顺序与执行原理篇
2018/01/14 Javascript
jQuery实现标签子元素的添加和赋值方法
2018/02/24 jQuery
python命令行参数sys.argv使用示例
2014/01/28 Python
Python实现把回车符\r\n转换成\n
2015/04/23 Python
python+VTK环境搭建及第一个简单程序代码
2017/12/13 Python
详解Python中的四种队列
2018/05/21 Python
对python 自定义协议的方法详解
2019/02/13 Python
Python JSON格式数据的提取和保存的实现
2019/03/22 Python
pip已经安装好第三方库但pycharm中import时还是标红的解决方案
2020/10/09 Python
Python Selenium破解滑块验证码最新版(GEETEST95%以上通过率)
2021/01/29 Python
Geekbuying波兰:购买中国电子产品
2019/10/20 全球购物
SQL Server数据库笔试题和答案
2016/02/04 面试题
社区七一党员活动方案
2014/01/25 职场文书
社区反邪教工作方案
2014/06/16 职场文书
先进集体申报材料
2014/12/25 职场文书
就业推荐表导师评语
2014/12/31 职场文书
2015年行政部工作总结
2015/04/28 职场文书