Python Pandas批量读取csv文件到dataframe的方法


Posted in Python onOctober 08, 2018

PYTHON Pandas批量读取csv文件到DATAFRAME

Python Pandas批量读取csv文件到dataframe的方法

首先使用glob.glob获得文件路径。然后定义一个列表,读取文件后再使用concat合并读取到的数据。

#读取数据
import pandas as pd
import numpy as np
import glob,os
path=r'e:\tj\month\fx1806'
file=glob.glob(os.path.join(path, "zq*.xls"))
print(file)
dl= []
for f in file:
 dl.append(pd.read_excel(f,header=[0,1],index_col=None))
df=pd.concat(dl)

下面看下Python使用pandas处理CSV文件的方法

Python中有许多方便的库可以用来进行数据处理,尤其是Numpy和Pandas,再搭配matplot画图专用模块,功能十分强大。

CSV(Comma-Separated Values)格式的文件是指以纯文本形式存储的表格数据,这意味着不能简单的使用Excel表格工具进行处理,而且Excel表格处理的数据量十分有限,而使用Pandas来处理数据量巨大的CSV文件就容易的多了。

我用到的是自己用其他硬件工具抓取得数据,硬件环境是在Linux平台上搭建的,当时数据是在运行脚本后直接输出在terminal里的,数据量十分庞大,为了保存获得的数据,在Linux下使用了数据流重定向,把数据全部保存到了文本文件中,形成了一个本地csv文件。

Pandas读取本地CSV文件并设置Dataframe(数据格式)

import pandas as pd
import numpy as np
df=pd.read_csv('filename',header=None,sep=' ') #filename可以直接从盘符开始,标明每一级的文件夹直到csv文件,header=None表示头部为空,sep=' '表示数据间使用空格作为分隔符,如果分隔符是逗号,只需换成 ‘,'即可。
print df.head()
print df.tail()
#作为示例,输出CSV文件的前5行和最后5行,这是pandas默认的输出5行,可以根据需要自己设定输出几行的值

Python Pandas批量读取csv文件到dataframe的方法

图片中显示了我本地数据的前5行与最后5行,最前面一列没有标号的是行号,数据一共有13列,标号从0到12,一行显示不完全,在第9列以后换了行,并且用反斜杠“\”标注了出来。

2017年4月28日更新

使用pandas直接读取本地的csv文件后,csv文件的列索引默认为从0开始的数字,重定义列索引的语句如下:

import pandas as pd
import numpy as np
df=pd.read_csv('filename',header=None,sep=' ',names=["week",'month','date','time','year','name1','freq1','name2','freq2','name3','data1','name4','data2'])
print df1234

此时打印出的文件信息如下,列索引已经被重命名:

Python Pandas批量读取csv文件到dataframe的方法

总结

以上所述是小编给大家介绍的Python Pandas批量读取csv文件到dataframe的方法,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对三水点靠木网站的支持!

Python 相关文章推荐
Python解析网页源代码中的115网盘链接实例
Sep 30 Python
Python的math模块中的常用数学函数整理
Feb 04 Python
Python实现的选择排序算法原理与用法实例分析
Nov 22 Python
实例分析python3实现并发访问水平切分表
Sep 29 Python
pygame游戏之旅 添加游戏介绍
Nov 20 Python
python实现贪吃蛇游戏
Mar 21 Python
python字典一键多值实例代码分享
Jun 14 Python
Django ORM 聚合查询和分组查询实现详解
Aug 09 Python
pywinauto自动化操作记事本
Aug 26 Python
基于python实现蓝牙通信代码实例
Nov 19 Python
Tensorflow加载Vgg预训练模型操作
May 26 Python
Python Celery异步任务队列使用方法解析
Aug 10 Python
Python中的函数式编程:不可变的数据结构
Oct 08 #Python
详解多线程Django程序耗尽数据库连接的问题
Oct 08 #Python
JSON文件及Python对JSON文件的读写操作
Oct 07 #Python
Python实现登陆文件验证方法
Oct 06 #Python
python对日志进行处理的实例代码
Oct 06 #Python
浅析Python函数式编程
Oct 06 #Python
Python实现iOS自动化打包详解步骤
Oct 03 #Python
You might like
PHP实现的多彩标签效果代码分享
2014/08/21 PHP
PHP设计模式之适配器模式代码实例
2015/05/11 PHP
PHP开发中常用的十个代码样例
2016/02/02 PHP
php 的反射详解及示例代码
2016/08/25 PHP
ASP小贴士/ASP Tips javascript tips可以当桌面
2009/12/10 Javascript
给jqGrid数据行添加修改和删除操作链接(之一)
2011/11/04 Javascript
SWFObject基本用法实例分析
2015/07/20 Javascript
JavaScript高级程序设计(第三版)学习笔记1~5章
2016/03/11 Javascript
实例解析jQuery工具函数
2016/12/01 Javascript
详解在Vue中通过自定义指令获取dom元素
2017/03/04 Javascript
vue插件vue-resource的使用笔记(小结)
2017/08/04 Javascript
webpack打包nodejs项目的方法
2018/09/26 NodeJs
基于leaflet.js实现修改地图主题样式的流程分析
2020/05/15 Javascript
Node.js web 应用如何封装到Docker容器中
2020/09/01 Javascript
通过实例解析jQ Ajax操作相关原理
2020/09/23 Javascript
[01:07:15]DOTA2-DPC中国联赛 正赛 DLG vs XG BO3 第二场 1月25日
2021/03/11 DOTA
如何搜索查找并解决Django相关的问题
2014/06/30 Python
Python使用pylab库实现画线功能的方法详解
2017/06/08 Python
使用pandas中的DataFrame数据绘制柱状图的方法
2018/04/10 Python
django自带的server 让外网主机访问方法
2018/05/14 Python
python绘制中国大陆人口热力图
2018/11/07 Python
python面试题之列表声明实例分析
2019/07/08 Python
使用Python实现跳一跳自动跳跃功能
2019/07/10 Python
Django中URL的参数传递的实现
2019/08/04 Python
解决django的template中如果无法引用MEDIA_URL问题
2020/04/07 Python
纯DOM+CSS3实现简单的小风车动画
2016/09/27 HTML / CSS
ECCO爱步加拿大官网:北欧丹麦鞋履及皮具品牌
2017/07/08 全球购物
巴西男士个人护理产品商店:SHOP4MEN
2017/08/07 全球购物
五一手机促销方案
2014/03/08 职场文书
幼儿园大班毕业教师寄语
2014/04/03 职场文书
幼儿园家长评语大全
2014/04/16 职场文书
2014年中秋节活动总结
2014/08/29 职场文书
2015年店长工作总结范文
2015/04/08 职场文书
出生证明范本
2015/06/15 职场文书
分析JVM源码之Thread.interrupt系统级别线程打断
2021/06/29 Java/Android
Python Django / Flask如何使用Elasticsearch
2022/04/19 Python