Python Pandas批量读取csv文件到dataframe的方法


Posted in Python onOctober 08, 2018

PYTHON Pandas批量读取csv文件到DATAFRAME

Python Pandas批量读取csv文件到dataframe的方法

首先使用glob.glob获得文件路径。然后定义一个列表,读取文件后再使用concat合并读取到的数据。

#读取数据
import pandas as pd
import numpy as np
import glob,os
path=r'e:\tj\month\fx1806'
file=glob.glob(os.path.join(path, "zq*.xls"))
print(file)
dl= []
for f in file:
 dl.append(pd.read_excel(f,header=[0,1],index_col=None))
df=pd.concat(dl)

下面看下Python使用pandas处理CSV文件的方法

Python中有许多方便的库可以用来进行数据处理,尤其是Numpy和Pandas,再搭配matplot画图专用模块,功能十分强大。

CSV(Comma-Separated Values)格式的文件是指以纯文本形式存储的表格数据,这意味着不能简单的使用Excel表格工具进行处理,而且Excel表格处理的数据量十分有限,而使用Pandas来处理数据量巨大的CSV文件就容易的多了。

我用到的是自己用其他硬件工具抓取得数据,硬件环境是在Linux平台上搭建的,当时数据是在运行脚本后直接输出在terminal里的,数据量十分庞大,为了保存获得的数据,在Linux下使用了数据流重定向,把数据全部保存到了文本文件中,形成了一个本地csv文件。

Pandas读取本地CSV文件并设置Dataframe(数据格式)

import pandas as pd
import numpy as np
df=pd.read_csv('filename',header=None,sep=' ') #filename可以直接从盘符开始,标明每一级的文件夹直到csv文件,header=None表示头部为空,sep=' '表示数据间使用空格作为分隔符,如果分隔符是逗号,只需换成 ‘,'即可。
print df.head()
print df.tail()
#作为示例,输出CSV文件的前5行和最后5行,这是pandas默认的输出5行,可以根据需要自己设定输出几行的值

Python Pandas批量读取csv文件到dataframe的方法

图片中显示了我本地数据的前5行与最后5行,最前面一列没有标号的是行号,数据一共有13列,标号从0到12,一行显示不完全,在第9列以后换了行,并且用反斜杠“\”标注了出来。

2017年4月28日更新

使用pandas直接读取本地的csv文件后,csv文件的列索引默认为从0开始的数字,重定义列索引的语句如下:

import pandas as pd
import numpy as np
df=pd.read_csv('filename',header=None,sep=' ',names=["week",'month','date','time','year','name1','freq1','name2','freq2','name3','data1','name4','data2'])
print df1234

此时打印出的文件信息如下,列索引已经被重命名:

Python Pandas批量读取csv文件到dataframe的方法

总结

以上所述是小编给大家介绍的Python Pandas批量读取csv文件到dataframe的方法,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对三水点靠木网站的支持!

Python 相关文章推荐
用Python实现命令行闹钟脚本实例
Sep 05 Python
Python中表示字符串的三种方法
Sep 06 Python
python正则实现提取电话功能
Feb 24 Python
python批量设置多个Excel文件页眉页脚的脚本
Mar 14 Python
python+influxdb+shell编写区域网络状况表
Jul 27 Python
详解pandas.DataFrame中删除包涵特定字符串所在的行
Apr 04 Python
Python3使用TCP编写一个简易的文件下载器功能
May 08 Python
python实现基于朴素贝叶斯的垃圾分类算法
Jul 09 Python
微信小程序python用户认证的实现
Jul 29 Python
python pyenv多版本管理工具的使用
Dec 23 Python
python 利用 PIL 将数组值转成图片的实现
Apr 12 Python
python 多态 协议 鸭子类型详解
Nov 27 Python
Python中的函数式编程:不可变的数据结构
Oct 08 #Python
详解多线程Django程序耗尽数据库连接的问题
Oct 08 #Python
JSON文件及Python对JSON文件的读写操作
Oct 07 #Python
Python实现登陆文件验证方法
Oct 06 #Python
python对日志进行处理的实例代码
Oct 06 #Python
浅析Python函数式编程
Oct 06 #Python
Python实现iOS自动化打包详解步骤
Oct 03 #Python
You might like
与空气斗智斗勇的经典《Overlord》,传说中的“无稽之谈”
2020/04/09 日漫
我的群发邮件程序
2006/10/09 PHP
PHP中改变图片的尺寸大小的代码
2011/07/17 PHP
PHP中实现crontab代码分享
2015/03/26 PHP
PHP实现加强版加密解密类实例
2015/07/29 PHP
PHP+JS实现的商品秒杀倒计时用法示例
2016/11/15 PHP
thinkPHP中钩子的使用方法实例分析
2017/11/16 PHP
使用XHProf查找PHP性能瓶颈的实例
2017/12/13 PHP
基于jquery的图片轮播 tab切换组件
2012/07/19 Javascript
提取jquery的ready()方法单独使用示例
2014/03/25 Javascript
把Node.js程序加入服务实现随机启动
2015/06/25 Javascript
理解JS事件循环
2016/01/07 Javascript
基于canvas实现的绚丽圆圈效果完整实例
2016/01/26 Javascript
逻辑表达式中与或非的用法详解
2016/06/06 Javascript
jquery实现简单Tab切换菜单效果
2020/07/17 Javascript
Javascript 实现简单计算器实例代码
2016/10/23 Javascript
jQuery图片切换动画特效
2016/11/02 Javascript
JavaScript中transform实现数字翻页效果
2017/03/08 Javascript
JavaScript组件开发之输入框加候选框
2017/03/10 Javascript
浅谈vuex 闲置状态重置方案
2018/01/04 Javascript
vue v-model实现自定义样式多选与单选功能
2018/07/05 Javascript
Vue中使用vux配置代码详解
2018/09/16 Javascript
vue新vue-cli3环境配置和模拟json数据的实例
2018/09/19 Javascript
javascript 模块依赖管理的本质深入详解
2020/04/30 Javascript
vc6编写python扩展的方法分享
2014/01/17 Python
python pygame实现五子棋小游戏
2020/10/26 Python
Keds加拿大官网:购买帆布运动鞋和皮鞋
2019/09/26 全球购物
Tomcat的缺省是多少,怎么修改
2014/04/09 面试题
给女儿的表扬信
2014/01/18 职场文书
转预备党员政审材料
2014/02/06 职场文书
个人工作表现评语
2014/04/30 职场文书
质监局领导班子对照检查材料思想汇报
2014/09/27 职场文书
村主任个人对照检查材料
2014/10/01 职场文书
社区低保工作总结2015
2015/07/23 职场文书
golang中的并发和并行
2021/05/08 Golang
PyCharm 安装与使用配置教程(windows,mac通用)
2021/05/12 Python