Python使用pandas处理CSV文件的实例讲解


Posted in Python onJune 22, 2018

Python中有许多方便的库可以用来进行数据处理,尤其是Numpy和Pandas,再搭配matplot画图专用模块,功能十分强大。

CSV(Comma-Separated Values)格式的文件是指以纯文本形式存储的表格数据,这意味着不能简单的使用Excel表格工具进行处理,而且Excel表格处理的数据量十分有限,而使用Pandas来处理数据量巨大的CSV文件就容易的多了。

我用到的是自己用其他硬件工具抓取得数据,硬件环境是在Linux平台上搭建的,当时数据是在运行脚本后直接输出在terminal里的,数据量十分庞大,为了保存获得的数据,在Linux下使用了数据流重定向,把数据全部保存到了文本文件中,形成了一个本地csv文件。

Pandas读取本地CSV文件并设置Dataframe(数据格式)

import pandas as pd
import numpy as np
df=pd.read_csv('filename',header=None,sep=' ') #filename可以直接从盘符开始,标明每一级的文件夹直到csv文件,header=None表示头部为空,sep=' '表示数据间使用空格作为分隔符,如果分隔符是逗号,只需换成 ‘,'即可。
print df.head()
print df.tail()
#作为示例,输出CSV文件的前5行和最后5行,这是pandas默认的输出5行,可以根据需要自己设定输出几行的值

Python使用pandas处理CSV文件的实例讲解

数据读取示例

图片中显示了我本地数据的前5行与最后5行,最前面一列没有标号的是行号,数据一共有13列,标号从0到12,一行显示不完全,在第9列以后换了行,并且用反斜杠“\”标注了出来。

2017年4月28日更新

使用pandas直接读取本地的csv文件后,csv文件的列索引默认为从0开始的数字,重定义列索引的语句如下:

import pandas as pd
import numpy as np
df=pd.read_csv('filename',header=None,sep=' ',names=["week",'month','date','time','year','name1','freq1','name2','freq2','name3','data1','name4','data2'])
print df

此时打印出的文件信息如下,列索引已经被重命名:

Python使用pandas处理CSV文件的实例讲解

以上这篇Python使用pandas处理CSV文件的实例讲解就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
K-means聚类算法介绍与利用python实现的代码示例
Nov 13 Python
详解Python 装饰器执行顺序迷思
Aug 08 Python
Tensorflow使用支持向量机拟合线性回归
Sep 07 Python
python+flask实现API的方法
Nov 21 Python
opencv实现简单人脸识别
Feb 19 Python
详解Python self 参数
Aug 30 Python
Django 自动生成api接口文档教程
Nov 19 Python
简单了解python装饰器原理及使用方法
Dec 18 Python
python 爬取马蜂窝景点翻页文字评论的实现
Jan 20 Python
使用Python实现Wake On Lan远程开机功能
Jan 22 Python
python 追踪except信息方式
Apr 25 Python
Python爬虫实现HTTP网络请求多种实现方式
Jun 19 Python
python处理csv中的空值方法
Jun 22 #Python
Python实现base64编码的图片保存到本地功能示例
Jun 22 #Python
关于python2 csv写入空白行的问题
Jun 22 #Python
浅谈Python2、Python3相对路径、绝对路径导入方法
Jun 22 #Python
Python基于pandas实现json格式转换成dataframe的方法
Jun 22 #Python
深入浅析Python的类
Jun 22 #Python
基于python绘制科赫雪花
Jun 22 #Python
You might like
thinkphp使用phpmailer发送邮件的方法
2014/11/24 PHP
php自定义函数实现二维数组排序功能
2016/07/20 PHP
jquery ui dialog里调用datepicker的问题
2009/08/06 Javascript
JS获取几种URL地址的方法小结
2014/02/26 Javascript
js判断复选框是否选中及选中个数的实现代码
2016/05/30 Javascript
一种基于浏览器的自动小票机打印实现方案(js版)
2016/07/26 Javascript
浅谈jQuery hover(over, out)事件函数
2016/12/03 Javascript
详解JavaScript时间处理之几个月前或几个月后的指定日期
2016/12/21 Javascript
js实现二级导航功能
2017/03/03 Javascript
HTML5实现微信拍摄上传照片功能
2017/04/21 Javascript
vue-cli项目优化方法- 缩短首屏加载时间
2018/04/01 Javascript
Angular使用动态加载组件方法实现Dialog的示例
2018/05/11 Javascript
React全家桶环境搭建过程详解
2018/05/18 Javascript
基于vue的验证码组件的示例代码
2019/01/22 Javascript
JS使用iView的Dropdown实现一个右键菜单
2019/05/06 Javascript
vite2.0+vue3移动端项目实战详解
2021/03/03 Vue.js
Windows下安装python2.7及科学计算套装
2015/03/05 Python
Python实现比较两个文件夹中代码变化的方法
2015/07/10 Python
用Python的Flask框架结合MySQL写一个内存监控程序
2015/11/07 Python
使用50行Python代码从零开始实现一个AI平衡小游戏
2018/11/21 Python
python 二维数组90度旋转的方法
2019/01/28 Python
python实现最小二乘法线性拟合
2019/07/19 Python
Flask框架模板渲染操作简单示例
2019/07/31 Python
Django项目之Elasticsearch搜索引擎的实例
2019/08/21 Python
Python中的面向接口编程示例详解
2021/01/17 Python
利用css3 translate完美实现表头固定效果
2017/02/28 HTML / CSS
毕业生的自我鉴定
2013/10/29 职场文书
kfc实习自我鉴定
2013/12/14 职场文书
岗位廉洁从业承诺书
2014/03/28 职场文书
村党支部书记四风问题个人对照检查材料思想汇报
2014/10/06 职场文书
考试作弊检讨书
2014/10/21 职场文书
初三毕业评语
2014/12/26 职场文书
2016年最美孝心少年事迹材料
2016/02/26 职场文书
pytorch 如何使用float64训练
2021/05/24 Python
CSS3实现列表无限滚动/轮播效果
2021/06/23 HTML / CSS
简单聊聊Golang中defer预计算参数
2022/03/25 Golang