Python Pandas批量读取csv文件到dataframe的方法


Posted in Python onOctober 08, 2018

PYTHON Pandas批量读取csv文件到DATAFRAME

Python Pandas批量读取csv文件到dataframe的方法

首先使用glob.glob获得文件路径。然后定义一个列表,读取文件后再使用concat合并读取到的数据。

#读取数据
import pandas as pd
import numpy as np
import glob,os
path=r'e:\tj\month\fx1806'
file=glob.glob(os.path.join(path, "zq*.xls"))
print(file)
dl= []
for f in file:
 dl.append(pd.read_excel(f,header=[0,1],index_col=None))
df=pd.concat(dl)

下面看下Python使用pandas处理CSV文件的方法

Python中有许多方便的库可以用来进行数据处理,尤其是Numpy和Pandas,再搭配matplot画图专用模块,功能十分强大。

CSV(Comma-Separated Values)格式的文件是指以纯文本形式存储的表格数据,这意味着不能简单的使用Excel表格工具进行处理,而且Excel表格处理的数据量十分有限,而使用Pandas来处理数据量巨大的CSV文件就容易的多了。

我用到的是自己用其他硬件工具抓取得数据,硬件环境是在Linux平台上搭建的,当时数据是在运行脚本后直接输出在terminal里的,数据量十分庞大,为了保存获得的数据,在Linux下使用了数据流重定向,把数据全部保存到了文本文件中,形成了一个本地csv文件。

Pandas读取本地CSV文件并设置Dataframe(数据格式)

import pandas as pd
import numpy as np
df=pd.read_csv('filename',header=None,sep=' ') #filename可以直接从盘符开始,标明每一级的文件夹直到csv文件,header=None表示头部为空,sep=' '表示数据间使用空格作为分隔符,如果分隔符是逗号,只需换成 ‘,'即可。
print df.head()
print df.tail()
#作为示例,输出CSV文件的前5行和最后5行,这是pandas默认的输出5行,可以根据需要自己设定输出几行的值

Python Pandas批量读取csv文件到dataframe的方法

图片中显示了我本地数据的前5行与最后5行,最前面一列没有标号的是行号,数据一共有13列,标号从0到12,一行显示不完全,在第9列以后换了行,并且用反斜杠“\”标注了出来。

2017年4月28日更新

使用pandas直接读取本地的csv文件后,csv文件的列索引默认为从0开始的数字,重定义列索引的语句如下:

import pandas as pd
import numpy as np
df=pd.read_csv('filename',header=None,sep=' ',names=["week",'month','date','time','year','name1','freq1','name2','freq2','name3','data1','name4','data2'])
print df1234

此时打印出的文件信息如下,列索引已经被重命名:

Python Pandas批量读取csv文件到dataframe的方法

总结

以上所述是小编给大家介绍的Python Pandas批量读取csv文件到dataframe的方法,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对三水点靠木网站的支持!

Python 相关文章推荐
python打开url并按指定块读取网页内容的方法
Apr 29 Python
解读Python中degrees()方法的使用
May 18 Python
Python扫描IP段查看指定端口是否开放的方法
Jun 09 Python
Python使用正则表达式抓取网页图片的方法示例
Apr 21 Python
python进程管理工具supervisor的安装与使用教程
Sep 05 Python
python的构建工具setup.py的方法使用示例
Oct 23 Python
十分钟利用Python制作属于你自己的个性logo
May 07 Python
python批量查询、汉字去重处理CSV文件
May 31 Python
flask-socketio实现WebSocket的方法
Jul 31 Python
Python图像处理之直线和曲线的拟合与绘制【curve_fit()应用】
Dec 26 Python
Python3如何使用range函数替代xrange函数
Oct 05 Python
Jupyter notebook命令和编辑模式常用快捷键汇总
Nov 17 Python
Python中的函数式编程:不可变的数据结构
Oct 08 #Python
详解多线程Django程序耗尽数据库连接的问题
Oct 08 #Python
JSON文件及Python对JSON文件的读写操作
Oct 07 #Python
Python实现登陆文件验证方法
Oct 06 #Python
python对日志进行处理的实例代码
Oct 06 #Python
浅析Python函数式编程
Oct 06 #Python
Python实现iOS自动化打包详解步骤
Oct 03 #Python
You might like
网站加速 PHP 缓冲的免费实现方法
2006/10/09 PHP
php smarty模版引擎中的缓存应用
2009/12/11 PHP
php之Smarty模板使用方法示例详解
2014/07/08 PHP
CodeIgniter框架数据库事务处理的设计缺陷和解决方案
2014/07/25 PHP
PHP中array_slice函数用法实例详解
2014/11/25 PHP
PHP数组式访问接口ArrayAccess用法分析
2017/12/28 PHP
Thinkphp5.0框架使用模型Model的获取器、修改器、软删除数据操作示例
2019/10/11 PHP
js TextArea的选中区域处理
2010/12/28 Javascript
jQuery jqgrid 对含特殊字符json 数据的 Java 处理方法
2011/01/01 Javascript
百度地图api应用标注地理位置信息(js版)
2013/02/01 Javascript
使用POST方式弹出窗口的两种方法示例介绍
2014/01/29 Javascript
document.addEventListener使用介绍
2014/03/07 Javascript
jquery序列化方法实例分析
2015/06/10 Javascript
浅谈angularjs module返回对象的坑(推荐)
2016/10/21 Javascript
Javascript DOM事件操作小结(监听鼠标点击、释放,悬停、离开等)
2017/01/20 Javascript
JavaScript数据结构学习之数组、栈与队列
2017/05/02 Javascript
详解vue.js+UEditor集成 [前后端分离项目]
2017/07/07 Javascript
Angular 组件之间的交互的示例代码
2018/03/24 Javascript
解决angular2 获取到的数据无法实时更新的问题
2018/08/31 Javascript
JS/HTML5游戏常用算法之碰撞检测 包围盒检测算法详解【矩形情况】
2018/12/13 Javascript
在Vue项目中用fullcalendar制作日程表的示例代码
2019/08/04 Javascript
微信域名检测接口调用演示步骤(含PHP、Python)
2019/12/08 Javascript
vue中如何添加百度统计代码
2020/12/19 Vue.js
vue实现轮播图帧率播放
2021/01/26 Vue.js
Python的函数嵌套的使用方法
2014/01/24 Python
python机器学习库常用汇总
2017/11/15 Python
Python socket 套接字实现通信详解
2019/08/27 Python
如何基于Python获取图片的物理尺寸
2019/11/25 Python
python实现批处理文件
2020/07/28 Python
如何在python中实现线性回归
2020/08/10 Python
购买英国原创艺术:Art Gallery
2018/08/25 全球购物
税务干部鉴定材料
2014/02/11 职场文书
教师求职信
2014/06/17 职场文书
班子成员四风问题自我剖析材料
2014/09/29 职场文书
Python词云的正确实现方法实例
2021/05/08 Python
SpringBoot 集成短信和邮件 以阿里云短信服务为例
2022/04/22 Java/Android