Python Pandas批量读取csv文件到dataframe的方法


Posted in Python onOctober 08, 2018

PYTHON Pandas批量读取csv文件到DATAFRAME

Python Pandas批量读取csv文件到dataframe的方法

首先使用glob.glob获得文件路径。然后定义一个列表,读取文件后再使用concat合并读取到的数据。

#读取数据
import pandas as pd
import numpy as np
import glob,os
path=r'e:\tj\month\fx1806'
file=glob.glob(os.path.join(path, "zq*.xls"))
print(file)
dl= []
for f in file:
 dl.append(pd.read_excel(f,header=[0,1],index_col=None))
df=pd.concat(dl)

下面看下Python使用pandas处理CSV文件的方法

Python中有许多方便的库可以用来进行数据处理,尤其是Numpy和Pandas,再搭配matplot画图专用模块,功能十分强大。

CSV(Comma-Separated Values)格式的文件是指以纯文本形式存储的表格数据,这意味着不能简单的使用Excel表格工具进行处理,而且Excel表格处理的数据量十分有限,而使用Pandas来处理数据量巨大的CSV文件就容易的多了。

我用到的是自己用其他硬件工具抓取得数据,硬件环境是在Linux平台上搭建的,当时数据是在运行脚本后直接输出在terminal里的,数据量十分庞大,为了保存获得的数据,在Linux下使用了数据流重定向,把数据全部保存到了文本文件中,形成了一个本地csv文件。

Pandas读取本地CSV文件并设置Dataframe(数据格式)

import pandas as pd
import numpy as np
df=pd.read_csv('filename',header=None,sep=' ') #filename可以直接从盘符开始,标明每一级的文件夹直到csv文件,header=None表示头部为空,sep=' '表示数据间使用空格作为分隔符,如果分隔符是逗号,只需换成 ‘,'即可。
print df.head()
print df.tail()
#作为示例,输出CSV文件的前5行和最后5行,这是pandas默认的输出5行,可以根据需要自己设定输出几行的值

Python Pandas批量读取csv文件到dataframe的方法

图片中显示了我本地数据的前5行与最后5行,最前面一列没有标号的是行号,数据一共有13列,标号从0到12,一行显示不完全,在第9列以后换了行,并且用反斜杠“\”标注了出来。

2017年4月28日更新

使用pandas直接读取本地的csv文件后,csv文件的列索引默认为从0开始的数字,重定义列索引的语句如下:

import pandas as pd
import numpy as np
df=pd.read_csv('filename',header=None,sep=' ',names=["week",'month','date','time','year','name1','freq1','name2','freq2','name3','data1','name4','data2'])
print df1234

此时打印出的文件信息如下,列索引已经被重命名:

Python Pandas批量读取csv文件到dataframe的方法

总结

以上所述是小编给大家介绍的Python Pandas批量读取csv文件到dataframe的方法,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对三水点靠木网站的支持!

Python 相关文章推荐
python实现端口转发器的方法
Mar 13 Python
对于Python的Django框架使用的一些实用建议
Apr 03 Python
python3设计模式之简单工厂模式
Oct 17 Python
人机交互程序 python实现人机对话
Nov 14 Python
Python自定义函数定义,参数,调用代码解析
Dec 27 Python
python学生管理系统学习笔记
Mar 19 Python
python多线程与多进程及其区别详解
Aug 08 Python
关于PyTorch 自动求导机制详解
Aug 18 Python
Django自关联实现多级联动查询实例
May 19 Python
pandas创建DataFrame的7种方法小结
Jun 14 Python
python单元测试之pytest的使用
Jun 07 Python
python非标准时间的转换
Jul 25 Python
Python中的函数式编程:不可变的数据结构
Oct 08 #Python
详解多线程Django程序耗尽数据库连接的问题
Oct 08 #Python
JSON文件及Python对JSON文件的读写操作
Oct 07 #Python
Python实现登陆文件验证方法
Oct 06 #Python
python对日志进行处理的实例代码
Oct 06 #Python
浅析Python函数式编程
Oct 06 #Python
Python实现iOS自动化打包详解步骤
Oct 03 #Python
You might like
CURL状态码列表(详细)
2013/06/27 PHP
php7函数,声明,返回值等新特性介绍
2018/05/25 PHP
显示、隐藏密码
2006/07/01 Javascript
深入理解JavaScript系列(6):S.O.L.I.D五大原则之单一职责SRP
2012/01/15 Javascript
js简单实现HTML标签Select联动带跳转
2013/10/23 Javascript
详解jquery事件delegate()的使用方法
2016/01/25 Javascript
JavaScript中关于iframe滚动条的去除和保留
2016/11/17 Javascript
利用jquery禁止外层滚动条的滚动
2017/01/05 Javascript
关于vue.js过渡css类名的理解(推荐)
2017/04/10 Javascript
vue服务端渲染的实例代码
2017/08/28 Javascript
webpack+vue-cli项目中引入外部非模块格式js的方法
2018/09/28 Javascript
mpvue将vue项目转换为小程序
2018/09/30 Javascript
js实现黑白div块画空心的图形
2018/12/13 Javascript
实例讲解JavaScript预编译流程
2019/01/24 Javascript
Vue中Table组件行内右键菜单实现方法(基于 vue + AntDesign)
2019/11/21 Javascript
[41:08]TNC vs VG 2018国际邀请赛小组赛BO2 第一场 8.16
2018/08/17 DOTA
[55:44]OG vs NAVI 2019国际邀请赛小组赛 BO2 第一场 8.15
2019/08/17 DOTA
图文讲解选择排序算法的原理及在Python中的实现
2016/05/04 Python
轻松实现TensorFlow微信跳一跳的AI
2018/01/05 Python
python模拟表单提交登录图书馆
2018/04/27 Python
解决csv.writer写入文件有多余的空行问题
2018/07/06 Python
python flask实现分页的示例代码
2018/08/02 Python
pip install python 快速安装模块的教程图解
2019/10/08 Python
python之生成多层json结构的实现
2020/02/27 Python
Python使用pyexecjs代码案例解析
2020/07/13 Python
python的数学算法函数及公式用法
2020/11/18 Python
纯css3制作网站后台管理面板
2014/12/30 HTML / CSS
通过HTML5 Canvas API绘制弧线和圆形的教程
2016/03/14 HTML / CSS
荟萃全球保健品:维他购
2018/05/09 全球购物
澳大利亚领先的武术用品和健身器材供应商:SMAI
2019/03/24 全球购物
解释DataSet(ds) 和 ds as DataSet 的含义
2014/07/27 面试题
毕业设计计划书
2014/01/09 职场文书
银行求职信
2014/05/31 职场文书
高职教师先进事迹材料
2014/08/24 职场文书
pandas进行数据输入和输出的方法详解
2022/03/23 Python
利用Python实时获取steam特惠游戏数据
2022/06/25 Python