Python Pandas批量读取csv文件到dataframe的方法


Posted in Python onOctober 08, 2018

PYTHON Pandas批量读取csv文件到DATAFRAME

Python Pandas批量读取csv文件到dataframe的方法

首先使用glob.glob获得文件路径。然后定义一个列表,读取文件后再使用concat合并读取到的数据。

#读取数据
import pandas as pd
import numpy as np
import glob,os
path=r'e:\tj\month\fx1806'
file=glob.glob(os.path.join(path, "zq*.xls"))
print(file)
dl= []
for f in file:
 dl.append(pd.read_excel(f,header=[0,1],index_col=None))
df=pd.concat(dl)

下面看下Python使用pandas处理CSV文件的方法

Python中有许多方便的库可以用来进行数据处理,尤其是Numpy和Pandas,再搭配matplot画图专用模块,功能十分强大。

CSV(Comma-Separated Values)格式的文件是指以纯文本形式存储的表格数据,这意味着不能简单的使用Excel表格工具进行处理,而且Excel表格处理的数据量十分有限,而使用Pandas来处理数据量巨大的CSV文件就容易的多了。

我用到的是自己用其他硬件工具抓取得数据,硬件环境是在Linux平台上搭建的,当时数据是在运行脚本后直接输出在terminal里的,数据量十分庞大,为了保存获得的数据,在Linux下使用了数据流重定向,把数据全部保存到了文本文件中,形成了一个本地csv文件。

Pandas读取本地CSV文件并设置Dataframe(数据格式)

import pandas as pd
import numpy as np
df=pd.read_csv('filename',header=None,sep=' ') #filename可以直接从盘符开始,标明每一级的文件夹直到csv文件,header=None表示头部为空,sep=' '表示数据间使用空格作为分隔符,如果分隔符是逗号,只需换成 ‘,'即可。
print df.head()
print df.tail()
#作为示例,输出CSV文件的前5行和最后5行,这是pandas默认的输出5行,可以根据需要自己设定输出几行的值

Python Pandas批量读取csv文件到dataframe的方法

图片中显示了我本地数据的前5行与最后5行,最前面一列没有标号的是行号,数据一共有13列,标号从0到12,一行显示不完全,在第9列以后换了行,并且用反斜杠“\”标注了出来。

2017年4月28日更新

使用pandas直接读取本地的csv文件后,csv文件的列索引默认为从0开始的数字,重定义列索引的语句如下:

import pandas as pd
import numpy as np
df=pd.read_csv('filename',header=None,sep=' ',names=["week",'month','date','time','year','name1','freq1','name2','freq2','name3','data1','name4','data2'])
print df1234

此时打印出的文件信息如下,列索引已经被重命名:

Python Pandas批量读取csv文件到dataframe的方法

总结

以上所述是小编给大家介绍的Python Pandas批量读取csv文件到dataframe的方法,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对三水点靠木网站的支持!

Python 相关文章推荐
python修改字典内key对应值的方法
Jul 11 Python
Python在Windows和在Linux下调用动态链接库的教程
Aug 18 Python
python爬虫入门教程--快速理解HTTP协议(一)
May 25 Python
python OpenCV学习笔记之绘制直方图的方法
Feb 08 Python
Python批量合并有合并单元格的Excel文件详解
Apr 05 Python
Python实现简单的用户交互方法详解
Sep 25 Python
对python制作自己的数据集实例讲解
Dec 12 Python
浅谈pandas筛选出表中满足另一个表所有条件的数据方法
Feb 08 Python
python django下载大的csv文件实现方法分析
Jul 19 Python
解决pymysql cursor.fetchall() 获取不到数据的问题
May 15 Python
详解使用Python写一个向数据库填充数据的小工具(推荐)
Sep 11 Python
python 基于opencv实现图像增强
Dec 23 Python
Python中的函数式编程:不可变的数据结构
Oct 08 #Python
详解多线程Django程序耗尽数据库连接的问题
Oct 08 #Python
JSON文件及Python对JSON文件的读写操作
Oct 07 #Python
Python实现登陆文件验证方法
Oct 06 #Python
python对日志进行处理的实例代码
Oct 06 #Python
浅析Python函数式编程
Oct 06 #Python
Python实现iOS自动化打包详解步骤
Oct 03 #Python
You might like
php上传文件的增强函数
2010/07/21 PHP
解析php中memcache的应用
2013/06/18 PHP
php中{}大括号是什么意思
2013/12/01 PHP
TP5框架实现上传多张图片的方法分析
2020/03/29 PHP
window.onload 加载完毕的问题及解决方案(上)
2009/07/09 Javascript
禁止js文件缓存的代码
2010/04/09 Javascript
jquery 设置元素相对于另一个元素的top值(实例代码)
2013/11/06 Javascript
JavaScript在IE和FF下的兼容性问题
2014/05/19 Javascript
解决自定义$(id)的方法与jquery选择器$冲突的问题
2014/06/14 Javascript
jquery实现textarea 高度自适应
2015/03/11 Javascript
利用JQuery实现datatables插件的增加和删除行功能
2017/01/06 Javascript
vue实现动态数据绑定
2017/04/28 Javascript
React-Router如何进行页面权限管理的方法
2017/12/06 Javascript
Node.js HTTP服务器中的文件、图片上传的方法
2019/09/23 Javascript
Nuxt.js nuxt-link与router-link的区别说明
2020/11/06 Javascript
[03:11]DOTA2上海特锦赛小组赛第一日recap精彩回顾
2016/02/28 DOTA
python使用mysqldb连接数据库操作方法示例详解
2013/12/03 Python
Django集成百度富文本编辑器uEditor攻略
2014/07/04 Python
Django中URL视图函数的一些高级概念介绍
2015/07/20 Python
Python的Django框架中自定义模版标签的示例
2015/07/20 Python
Python3实现的画图及加载图片动画效果示例
2018/01/19 Python
使用Python制作微信跳一跳辅助
2018/01/31 Python
python pcm音频添加头转成Wav格式文件的方法
2019/01/09 Python
Python小白必备的8个最常用的内置函数(推荐)
2019/04/03 Python
django url到views参数传递的实例
2019/07/19 Python
对python中基于tcp协议的通信(数据传输)实例讲解
2019/07/22 Python
Python中用pyinstaller打包时的图标问题及解决方法
2020/02/17 Python
关于box-sizing的全面理解
2016/07/28 HTML / CSS
html5使用canvas绘制太阳系效果
2014/12/15 HTML / CSS
澳大利亚最受欢迎的超级商场每日优惠:Catch
2020/11/17 全球购物
运动会跳远广播稿5篇
2014/09/17 职场文书
2014学校领导四风问题对照检查材料思想汇报
2014/09/22 职场文书
2014副镇长民主生活会个人对照检查材料思想汇报
2014/09/30 职场文书
家庭财产分割协议书范本
2014/11/24 职场文书
物业工程部岗位职责
2015/02/11 职场文书
tomcat的catalina.out日志按自定义时间格式进行分割的操作方法
2022/04/02 Servers