Python使用pandas处理CSV文件的实例讲解


Posted in Python onJune 22, 2018

Python中有许多方便的库可以用来进行数据处理,尤其是Numpy和Pandas,再搭配matplot画图专用模块,功能十分强大。

CSV(Comma-Separated Values)格式的文件是指以纯文本形式存储的表格数据,这意味着不能简单的使用Excel表格工具进行处理,而且Excel表格处理的数据量十分有限,而使用Pandas来处理数据量巨大的CSV文件就容易的多了。

我用到的是自己用其他硬件工具抓取得数据,硬件环境是在Linux平台上搭建的,当时数据是在运行脚本后直接输出在terminal里的,数据量十分庞大,为了保存获得的数据,在Linux下使用了数据流重定向,把数据全部保存到了文本文件中,形成了一个本地csv文件。

Pandas读取本地CSV文件并设置Dataframe(数据格式)

import pandas as pd
import numpy as np
df=pd.read_csv('filename',header=None,sep=' ') #filename可以直接从盘符开始,标明每一级的文件夹直到csv文件,header=None表示头部为空,sep=' '表示数据间使用空格作为分隔符,如果分隔符是逗号,只需换成 ‘,'即可。
print df.head()
print df.tail()
#作为示例,输出CSV文件的前5行和最后5行,这是pandas默认的输出5行,可以根据需要自己设定输出几行的值

Python使用pandas处理CSV文件的实例讲解

数据读取示例

图片中显示了我本地数据的前5行与最后5行,最前面一列没有标号的是行号,数据一共有13列,标号从0到12,一行显示不完全,在第9列以后换了行,并且用反斜杠“\”标注了出来。

2017年4月28日更新

使用pandas直接读取本地的csv文件后,csv文件的列索引默认为从0开始的数字,重定义列索引的语句如下:

import pandas as pd
import numpy as np
df=pd.read_csv('filename',header=None,sep=' ',names=["week",'month','date','time','year','name1','freq1','name2','freq2','name3','data1','name4','data2'])
print df

此时打印出的文件信息如下,列索引已经被重命名:

Python使用pandas处理CSV文件的实例讲解

以上这篇Python使用pandas处理CSV文件的实例讲解就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python实现给微信公众号发送消息的方法
Jun 30 Python
Python实现将文本生成二维码的方法示例
Jul 18 Python
python with提前退出遇到的坑与解决方案
Jan 05 Python
python 执行shell命令并将结果保存的实例
May 11 Python
python虚拟环境完美部署教程
Aug 06 Python
python的常见矩阵运算(小结)
Aug 07 Python
Python Process多进程实现过程
Oct 22 Python
带你彻底搞懂python操作mysql数据库(cursor游标讲解)
Jan 06 Python
python 穷举指定长度的密码例子
Apr 02 Python
python requests.get带header
May 05 Python
Python接收手机短信的代码整理
Aug 02 Python
python如何使用腾讯云发送短信
Sep 17 Python
python处理csv中的空值方法
Jun 22 #Python
Python实现base64编码的图片保存到本地功能示例
Jun 22 #Python
关于python2 csv写入空白行的问题
Jun 22 #Python
浅谈Python2、Python3相对路径、绝对路径导入方法
Jun 22 #Python
Python基于pandas实现json格式转换成dataframe的方法
Jun 22 #Python
深入浅析Python的类
Jun 22 #Python
基于python绘制科赫雪花
Jun 22 #Python
You might like
Flash空降上海 化身大魔王接受挑战
2020/03/02 星际争霸
浅谈apache和nginx的rewrite的区别
2013/02/22 PHP
PHP如何读取由JavaScript设置的Cookie
2017/03/22 PHP
用JavaScrpt实现文件夹简单轻松加密的实现方法图文
2008/09/08 Javascript
js模拟hashtable的简单实例
2014/03/06 Javascript
js防止DIV布局滚动时闪动的解决方法
2014/10/30 Javascript
使用js获取图片原始尺寸
2014/12/03 Javascript
javascript实现状态栏文字首尾相接循环滚动的方法
2015/07/22 Javascript
js实现Select列表内容自动滚动效果代码
2015/08/20 Javascript
js为什么不能正确处理小数运算?
2015/12/29 Javascript
Highcharts使用简例及异步动态读取数据
2015/12/30 Javascript
jQuery validate插件实现ajax验证重复的2种方法
2016/01/22 Javascript
浏览器复制插件zeroclipboard使用指南
2016/03/26 Javascript
JS模仿手机端九宫格登录功能实现代码
2016/04/28 Javascript
前端分页功能的实现以及原理(jQuery)
2017/01/22 Javascript
js前端实现图片懒加载(lazyload)的两种方式
2017/04/24 Javascript
七行JSON代码把你的网站变成移动应用过程详解
2019/07/09 Javascript
[01:04:32]DOTA2-DPC中国联赛 正赛 Aster vs LBZS BO3 第二场 2月23日
2021/03/11 DOTA
python简单猜数游戏实例
2015/07/09 Python
用Python一键搭建Http服务器的方法
2018/06/01 Python
python实现转圈打印矩阵
2019/03/02 Python
ML神器:sklearn的快速使用及入门
2019/07/11 Python
Python爬虫使用浏览器cookies:browsercookie过程解析
2019/10/22 Python
PyQt5 文本输入框自动补全QLineEdit的实现示例
2020/05/13 Python
纯CSS3实现鼠标悬停提示气泡效果
2014/02/28 HTML / CSS
纯css3使用vw和vh实现自适应的方法
2018/02/09 HTML / CSS
css3 中translate和transition的使用方法
2020/03/26 HTML / CSS
SQL Server的固定数据库角色都有哪些?对应的服务器权限有哪些?
2013/05/18 面试题
优秀毕业生推荐信
2013/11/02 职场文书
植树节活动总结
2014/04/30 职场文书
艺术学院毕业生自荐信
2014/07/05 职场文书
应届本科毕业生求职信
2014/07/23 职场文书
陕西导游词
2015/02/04 职场文书
通讯稿格式及范文
2015/07/22 职场文书
Golang二维数组的使用方式
2021/05/28 Golang
详解在OpenCV中如何使用图像像素
2022/03/03 Python