Python使用pandas处理CSV文件的实例讲解


Posted in Python onJune 22, 2018

Python中有许多方便的库可以用来进行数据处理,尤其是Numpy和Pandas,再搭配matplot画图专用模块,功能十分强大。

CSV(Comma-Separated Values)格式的文件是指以纯文本形式存储的表格数据,这意味着不能简单的使用Excel表格工具进行处理,而且Excel表格处理的数据量十分有限,而使用Pandas来处理数据量巨大的CSV文件就容易的多了。

我用到的是自己用其他硬件工具抓取得数据,硬件环境是在Linux平台上搭建的,当时数据是在运行脚本后直接输出在terminal里的,数据量十分庞大,为了保存获得的数据,在Linux下使用了数据流重定向,把数据全部保存到了文本文件中,形成了一个本地csv文件。

Pandas读取本地CSV文件并设置Dataframe(数据格式)

import pandas as pd
import numpy as np
df=pd.read_csv('filename',header=None,sep=' ') #filename可以直接从盘符开始,标明每一级的文件夹直到csv文件,header=None表示头部为空,sep=' '表示数据间使用空格作为分隔符,如果分隔符是逗号,只需换成 ‘,'即可。
print df.head()
print df.tail()
#作为示例,输出CSV文件的前5行和最后5行,这是pandas默认的输出5行,可以根据需要自己设定输出几行的值

Python使用pandas处理CSV文件的实例讲解

数据读取示例

图片中显示了我本地数据的前5行与最后5行,最前面一列没有标号的是行号,数据一共有13列,标号从0到12,一行显示不完全,在第9列以后换了行,并且用反斜杠“\”标注了出来。

2017年4月28日更新

使用pandas直接读取本地的csv文件后,csv文件的列索引默认为从0开始的数字,重定义列索引的语句如下:

import pandas as pd
import numpy as np
df=pd.read_csv('filename',header=None,sep=' ',names=["week",'month','date','time','year','name1','freq1','name2','freq2','name3','data1','name4','data2'])
print df

此时打印出的文件信息如下,列索引已经被重命名:

Python使用pandas处理CSV文件的实例讲解

以上这篇Python使用pandas处理CSV文件的实例讲解就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python搭建简易服务器分析与实现
Dec 15 Python
Python实现Linux下守护进程的编写方法
Aug 22 Python
python 列表,数组,矩阵两两转换tolist()的实例
Apr 04 Python
Flask框架Flask-Principal基本用法实例分析
Jul 23 Python
python内存动态分配过程详解
Jul 15 Python
django中media媒体路径设置的步骤
Nov 15 Python
TensorFlow梯度求解tf.gradients实例
Feb 04 Python
在TensorFlow中实现矩阵维度扩展
May 22 Python
如何在python中实现线性回归
Aug 10 Python
python如何运行js语句
Sep 09 Python
Kmeans均值聚类算法原理以及Python如何实现
Sep 26 Python
python利用opencv实现颜色检测
Feb 23 Python
python处理csv中的空值方法
Jun 22 #Python
Python实现base64编码的图片保存到本地功能示例
Jun 22 #Python
关于python2 csv写入空白行的问题
Jun 22 #Python
浅谈Python2、Python3相对路径、绝对路径导入方法
Jun 22 #Python
Python基于pandas实现json格式转换成dataframe的方法
Jun 22 #Python
深入浅析Python的类
Jun 22 #Python
基于python绘制科赫雪花
Jun 22 #Python
You might like
Windows下的PHP5.0详解
2006/11/18 PHP
php下intval()和(int)转换使用与区别
2008/07/18 PHP
php 获得汉字拼音首字母的函数
2009/08/01 PHP
PHP mcrypt可逆加密算法分析
2011/07/19 PHP
PHP在获取指定目录下的目录,在获取的目录下面再创建文件,多平台
2011/08/03 PHP
PHP实现自动对图片进行滚动显示的方法
2015/03/12 PHP
Laravel中任务调度console使用方法小结
2017/05/07 PHP
用javascript实现自定义标签
2007/05/08 Javascript
JS 进度条效果实现代码整理
2011/05/21 Javascript
SinaEditor使用方法详解
2013/12/28 Javascript
调用DOM对象的focus使文本框获得焦点
2014/02/19 Javascript
基于jquery实现的文字向上跑动类似跑马灯的效果
2014/06/17 Javascript
简单实现的JQuery文本框水印插件
2016/06/14 Javascript
微信小程序 wxapp内容组件 progress详细介绍
2016/10/31 Javascript
AngularJS服务service用法总结
2016/12/13 Javascript
Linux系统中利用node.js提取Word(doc/docx)及PDF文本的内容
2017/06/17 Javascript
JS HTML图片显示Canvas 压缩功能
2017/07/21 Javascript
JS+Canvas绘制动态时钟效果
2017/11/10 Javascript
vue实现自定义多选与单选的答题功能
2018/07/05 Javascript
Vue配置marked链接添加target="_blank"的方法
2019/07/19 Javascript
layui动态渲染生成select的option值方法
2019/09/23 Javascript
Angular6项目打包优化的实现方法
2019/12/15 Javascript
高性能js数组去重(12种方法,史上最全)
2019/12/21 Javascript
[10:34]DOTA2上海特级锦标赛全纪录
2016/03/25 DOTA
Python中的装饰器用法详解
2015/01/14 Python
Python编程求质数实例代码
2018/01/31 Python
python实现在函数中修改变量值的方法
2019/07/16 Python
对python中assert、isinstance的用法详解
2019/11/27 Python
详解python 内存优化
2020/08/17 Python
大学生的应聘自我评价
2013/12/13 职场文书
临床医师专业个人自我评价
2014/01/08 职场文书
2014年党务公开实施方案
2014/02/27 职场文书
机关职员工作检讨书
2014/10/23 职场文书
通报表扬范文
2015/01/17 职场文书
集团财务总监岗位职责
2015/04/03 职场文书
keepalived + nginx 实现高可用方案
2022/12/24 Servers