Python使用pandas处理CSV文件的实例讲解


Posted in Python onJune 22, 2018

Python中有许多方便的库可以用来进行数据处理,尤其是Numpy和Pandas,再搭配matplot画图专用模块,功能十分强大。

CSV(Comma-Separated Values)格式的文件是指以纯文本形式存储的表格数据,这意味着不能简单的使用Excel表格工具进行处理,而且Excel表格处理的数据量十分有限,而使用Pandas来处理数据量巨大的CSV文件就容易的多了。

我用到的是自己用其他硬件工具抓取得数据,硬件环境是在Linux平台上搭建的,当时数据是在运行脚本后直接输出在terminal里的,数据量十分庞大,为了保存获得的数据,在Linux下使用了数据流重定向,把数据全部保存到了文本文件中,形成了一个本地csv文件。

Pandas读取本地CSV文件并设置Dataframe(数据格式)

import pandas as pd
import numpy as np
df=pd.read_csv('filename',header=None,sep=' ') #filename可以直接从盘符开始,标明每一级的文件夹直到csv文件,header=None表示头部为空,sep=' '表示数据间使用空格作为分隔符,如果分隔符是逗号,只需换成 ‘,'即可。
print df.head()
print df.tail()
#作为示例,输出CSV文件的前5行和最后5行,这是pandas默认的输出5行,可以根据需要自己设定输出几行的值

Python使用pandas处理CSV文件的实例讲解

数据读取示例

图片中显示了我本地数据的前5行与最后5行,最前面一列没有标号的是行号,数据一共有13列,标号从0到12,一行显示不完全,在第9列以后换了行,并且用反斜杠“\”标注了出来。

2017年4月28日更新

使用pandas直接读取本地的csv文件后,csv文件的列索引默认为从0开始的数字,重定义列索引的语句如下:

import pandas as pd
import numpy as np
df=pd.read_csv('filename',header=None,sep=' ',names=["week",'month','date','time','year','name1','freq1','name2','freq2','name3','data1','name4','data2'])
print df

此时打印出的文件信息如下,列索引已经被重命名:

Python使用pandas处理CSV文件的实例讲解

以上这篇Python使用pandas处理CSV文件的实例讲解就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
用Python编写分析Python程序性能的工具的教程
Apr 01 Python
Unicode和Python的中文处理
Mar 19 Python
Django模板变量如何传递给外部js调用的方法小结
Jul 24 Python
儿童编程python入门
May 08 Python
python docx 中文字体设置的操作方法
May 08 Python
Python闭包执行时值的传递方式实例分析
Jun 04 Python
使用python读取.text文件特定行的数据方法
Jan 28 Python
python爬取cnvd漏洞库信息的实例
Feb 14 Python
Python tkinter 下拉日历控件代码
Mar 04 Python
python向企业微信发送文字和图片消息的示例
Sep 28 Python
python+opencv3.4.0 实现HOG+SVM行人检测的示例代码
Jan 28 Python
分享3个非常实用的 Python 模块
Mar 03 Python
python处理csv中的空值方法
Jun 22 #Python
Python实现base64编码的图片保存到本地功能示例
Jun 22 #Python
关于python2 csv写入空白行的问题
Jun 22 #Python
浅谈Python2、Python3相对路径、绝对路径导入方法
Jun 22 #Python
Python基于pandas实现json格式转换成dataframe的方法
Jun 22 #Python
深入浅析Python的类
Jun 22 #Python
基于python绘制科赫雪花
Jun 22 #Python
You might like
PHP取得一个类的属性和方法的实现代码
2011/05/22 PHP
yii框架使用分页的方法分析
2019/07/25 PHP
js编码之encodeURIComponent使用介绍(asp,php)
2012/03/01 Javascript
jQuery使用andSelf()来包含之前的选择集
2014/05/19 Javascript
JavaScript函数模式详解
2014/11/07 Javascript
node.js中的path.delimiter方法使用说明
2014/12/09 Javascript
JavaScript 里的类数组对象
2015/04/08 Javascript
jQuery+PHP+MySQL二级联动下拉菜单实例讲解
2015/10/27 Javascript
AngularJS下对数组的对比分析
2016/08/24 Javascript
微信公众平台开发教程(六)获取个性二维码的实例
2016/12/02 Javascript
vue.js将unix时间戳转换为自定义时间格式
2017/01/03 Javascript
webpack配置文件和常用配置项介绍
2017/04/28 Javascript
js实现字符全排列算法的简单方法
2017/05/01 Javascript
JavaScript继承与多继承实例分析
2018/05/26 Javascript
微信小程序利用for循环解决内容变更问题
2020/03/05 Javascript
vue 监听 Treeselect 选择项的改变操作
2020/08/31 Javascript
[11:12]2018DOTA2国际邀请赛寻真——绿色长城OpTic
2018/08/10 DOTA
Python中http请求方法库汇总
2016/01/06 Python
Python日期时间模块datetime详解与Python 日期时间的比较,计算实例代码
2018/09/14 Python
python和node.js生成当前时间戳的示例
2020/09/29 Python
Python txt文件如何转换成字典
2020/11/03 Python
html5 标签
2009/07/16 HTML / CSS
比驿:全球酒店比价网
2018/06/20 全球购物
美国气象仪器、花园装饰和墙壁艺术商店:Wind & Weather
2019/05/29 全球购物
泰海淘:泰国king Power王权免税集团旗下跨境海淘综合型电商
2020/07/26 全球购物
公共事业管理本科生求职信
2013/10/07 职场文书
化妆品店促销方案
2014/02/24 职场文书
历史专业大学生职业生涯规划书
2014/03/13 职场文书
销售职业生涯规划范文
2014/03/14 职场文书
新学期国旗下演讲稿
2014/05/08 职场文书
公务员学习习总书记“三严三实”思想汇报
2014/09/19 职场文书
群众路线党员个人整改措施
2014/10/27 职场文书
企业投资意向书
2015/05/09 职场文书
中学音乐课教学反思
2016/02/18 职场文书
画错魏国疆域啦!《派对咖孔明》动画因作画失误于官网致歉
2022/04/07 日漫
go goth封装第三方认证库示例详解
2022/08/14 Golang