Python使用pandas处理CSV文件的实例讲解


Posted in Python onJune 22, 2018

Python中有许多方便的库可以用来进行数据处理,尤其是Numpy和Pandas,再搭配matplot画图专用模块,功能十分强大。

CSV(Comma-Separated Values)格式的文件是指以纯文本形式存储的表格数据,这意味着不能简单的使用Excel表格工具进行处理,而且Excel表格处理的数据量十分有限,而使用Pandas来处理数据量巨大的CSV文件就容易的多了。

我用到的是自己用其他硬件工具抓取得数据,硬件环境是在Linux平台上搭建的,当时数据是在运行脚本后直接输出在terminal里的,数据量十分庞大,为了保存获得的数据,在Linux下使用了数据流重定向,把数据全部保存到了文本文件中,形成了一个本地csv文件。

Pandas读取本地CSV文件并设置Dataframe(数据格式)

import pandas as pd
import numpy as np
df=pd.read_csv('filename',header=None,sep=' ') #filename可以直接从盘符开始,标明每一级的文件夹直到csv文件,header=None表示头部为空,sep=' '表示数据间使用空格作为分隔符,如果分隔符是逗号,只需换成 ‘,'即可。
print df.head()
print df.tail()
#作为示例,输出CSV文件的前5行和最后5行,这是pandas默认的输出5行,可以根据需要自己设定输出几行的值

Python使用pandas处理CSV文件的实例讲解

数据读取示例

图片中显示了我本地数据的前5行与最后5行,最前面一列没有标号的是行号,数据一共有13列,标号从0到12,一行显示不完全,在第9列以后换了行,并且用反斜杠“\”标注了出来。

2017年4月28日更新

使用pandas直接读取本地的csv文件后,csv文件的列索引默认为从0开始的数字,重定义列索引的语句如下:

import pandas as pd
import numpy as np
df=pd.read_csv('filename',header=None,sep=' ',names=["week",'month','date','time','year','name1','freq1','name2','freq2','name3','data1','name4','data2'])
print df

此时打印出的文件信息如下,列索引已经被重命名:

Python使用pandas处理CSV文件的实例讲解

以上这篇Python使用pandas处理CSV文件的实例讲解就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python中from module import * 的一个坑
Jul 20 Python
搞笑的程序猿:看看你是哪种Python程序员
Jun 12 Python
python 根据正则表达式提取指定的内容实例详解
Dec 04 Python
python先序遍历二叉树问题
Nov 10 Python
利用Anaconda简单安装scrapy框架的方法
Jun 13 Python
Python 画出来六维图
Jul 26 Python
python使用yield压平嵌套字典的超简单方法
Nov 02 Python
Python字典底层实现原理详解
Dec 18 Python
Python3 A*寻路算法实现方式
Dec 24 Python
Numpy与Pytorch 矩阵操作方式
Dec 27 Python
python批量生成条形码的示例
Oct 10 Python
python如何快速拼接字符串
Oct 28 Python
python处理csv中的空值方法
Jun 22 #Python
Python实现base64编码的图片保存到本地功能示例
Jun 22 #Python
关于python2 csv写入空白行的问题
Jun 22 #Python
浅谈Python2、Python3相对路径、绝对路径导入方法
Jun 22 #Python
Python基于pandas实现json格式转换成dataframe的方法
Jun 22 #Python
深入浅析Python的类
Jun 22 #Python
基于python绘制科赫雪花
Jun 22 #Python
You might like
关于PHP5 Session生命周期介绍
2010/03/02 PHP
php 批量替换html标签的实例代码
2013/11/26 PHP
一个PHP针对数字的加密解密类
2014/03/20 PHP
IE iframe的onload方法分析小结
2010/01/07 Javascript
基于jquery的二级联动菜单实现代码
2011/04/25 Javascript
ExtJS的拖拽效果示例
2013/12/09 Javascript
php结合imgareaselect实现图片裁剪
2015/07/05 Javascript
快速实现JS图片懒加载(可视区域加载)示例代码
2017/01/04 Javascript
微信小程序中使用javascript 回调函数
2017/05/11 Javascript
利用node.js制作命令行工具方法教程(一)
2017/06/22 Javascript
vue select二级联动第二级默认选中第一个option值的实例
2018/01/10 Javascript
vue2.0.js的多级联动选择器实现方法
2018/02/09 Javascript
JS数组Object.keys()方法的使用示例
2019/06/05 Javascript
微信小程序图片加载失败时替换为默认图片的方法
2019/12/09 Javascript
微信小程序实现音乐播放页面布局
2020/12/11 Javascript
[48:44]2014 DOTA2国际邀请赛中国区预选赛5.21 TongFu VS HGT
2014/05/22 DOTA
[35:26]DOTA2上海特级锦标赛B组小组赛#2 VG VS Fnatic第三局
2016/02/26 DOTA
python3抓取中文网页的方法
2015/07/28 Python
Python第三方库的安装方法总结
2016/06/06 Python
Python3.6通过自带的urllib通过get或post方法请求url的实例
2018/05/10 Python
python使用numpy读取、保存txt数据的实例
2018/10/14 Python
Python3实现的简单三级菜单功能示例
2019/03/12 Python
python实现复制大量文件功能
2019/08/31 Python
python检查目录文件权限并修改目录文件权限的操作
2020/03/11 Python
在python下实现word2vec词向量训练与加载实例
2020/06/09 Python
Tensorflow使用Anaconda、pycharm安装记录
2020/07/29 Python
安装pyecharts1.8.0版本后导入pyecharts模块绘图时报错: “所有图表类型将在 v1.9.0 版本开始强制使用 ChartItem 进行数据项配置 ”的解决方法
2020/08/18 Python
Jupyter安装链接aconda实现过程图解
2020/11/02 Python
俄罗斯最大的在线手表商店:Bestwatch.ru
2020/01/11 全球购物
高中自我评价分享
2013/12/05 职场文书
2014年文学毕业生自我鉴定
2014/04/23 职场文书
音乐教育专业自荐信
2014/09/18 职场文书
失恋33天观后感
2015/06/11 职场文书
寻找最美乡村教师观后感
2015/06/18 职场文书
幼儿园小班开学寄语(2016秋季)
2015/12/03 职场文书
Javascript设计模式之原型模式详细
2021/10/05 Javascript