Python使用pandas处理CSV文件的实例讲解


Posted in Python onJune 22, 2018

Python中有许多方便的库可以用来进行数据处理,尤其是Numpy和Pandas,再搭配matplot画图专用模块,功能十分强大。

CSV(Comma-Separated Values)格式的文件是指以纯文本形式存储的表格数据,这意味着不能简单的使用Excel表格工具进行处理,而且Excel表格处理的数据量十分有限,而使用Pandas来处理数据量巨大的CSV文件就容易的多了。

我用到的是自己用其他硬件工具抓取得数据,硬件环境是在Linux平台上搭建的,当时数据是在运行脚本后直接输出在terminal里的,数据量十分庞大,为了保存获得的数据,在Linux下使用了数据流重定向,把数据全部保存到了文本文件中,形成了一个本地csv文件。

Pandas读取本地CSV文件并设置Dataframe(数据格式)

import pandas as pd
import numpy as np
df=pd.read_csv('filename',header=None,sep=' ') #filename可以直接从盘符开始,标明每一级的文件夹直到csv文件,header=None表示头部为空,sep=' '表示数据间使用空格作为分隔符,如果分隔符是逗号,只需换成 ‘,'即可。
print df.head()
print df.tail()
#作为示例,输出CSV文件的前5行和最后5行,这是pandas默认的输出5行,可以根据需要自己设定输出几行的值

Python使用pandas处理CSV文件的实例讲解

数据读取示例

图片中显示了我本地数据的前5行与最后5行,最前面一列没有标号的是行号,数据一共有13列,标号从0到12,一行显示不完全,在第9列以后换了行,并且用反斜杠“\”标注了出来。

2017年4月28日更新

使用pandas直接读取本地的csv文件后,csv文件的列索引默认为从0开始的数字,重定义列索引的语句如下:

import pandas as pd
import numpy as np
df=pd.read_csv('filename',header=None,sep=' ',names=["week",'month','date','time','year','name1','freq1','name2','freq2','name3','data1','name4','data2'])
print df

此时打印出的文件信息如下,列索引已经被重命名:

Python使用pandas处理CSV文件的实例讲解

以上这篇Python使用pandas处理CSV文件的实例讲解就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python中运行并行任务技巧
Feb 26 Python
python通过get,post方式发送http请求和接收http响应的方法
May 26 Python
Python实现随机选择元素功能
Sep 14 Python
numpy排序与集合运算用法示例
Dec 15 Python
Python Dataframe 指定多列去重、求差集的方法
Jul 10 Python
python实现在遍历列表时,直接对dict元素增加字段的方法
Jan 15 Python
python networkx 包绘制复杂网络关系图的实现
Jul 10 Python
基于python解线性矩阵方程(numpy中的matrix类)
Oct 21 Python
Python numpy线性代数用法实例解析
Nov 15 Python
使用python检查yaml配置文件是否符合要求
Apr 09 Python
浅析python 定时拆分备份 nginx 日志的方法
Apr 27 Python
简单了解python列表和元组的区别
May 14 Python
python处理csv中的空值方法
Jun 22 #Python
Python实现base64编码的图片保存到本地功能示例
Jun 22 #Python
关于python2 csv写入空白行的问题
Jun 22 #Python
浅谈Python2、Python3相对路径、绝对路径导入方法
Jun 22 #Python
Python基于pandas实现json格式转换成dataframe的方法
Jun 22 #Python
深入浅析Python的类
Jun 22 #Python
基于python绘制科赫雪花
Jun 22 #Python
You might like
destoon网站转移服务器后搜索汉字出现乱码的解决方法
2014/06/21 PHP
Javascript的IE和Firefox兼容性汇编(zz)
2007/02/02 Javascript
解析arp病毒背后利用的Javascript技术附解密方法
2007/08/06 Javascript
如何使用jQuery来处理图片坏链具体实现步骤
2013/05/02 Javascript
利用javascript打开模态对话框(示例代码)
2014/01/11 Javascript
javasciprt下jquery函数$.post执行无响应的解决方法
2014/03/13 Javascript
简单的jquery左侧导航栏和页面选中效果
2014/08/21 Javascript
使用jQuery实现页面定时弹出广告效果
2017/08/24 jQuery
VueJs监听window.resize方法示例
2018/01/17 Javascript
浅谈在vue中用webpack打包之后运行文件的问题以及相关配置方法
2018/02/21 Javascript
jQuery中复合选择器简单用法示例
2018/03/31 jQuery
vue实现的双向数据绑定操作示例
2018/12/04 Javascript
layui--js控制switch的切换方法
2019/09/03 Javascript
p5.js码绘“跳动的小正方形”的实现代码
2019/10/22 Javascript
[01:18]DOTA2超级联赛专访hanci ForLove淘汰感言曝光
2013/06/04 DOTA
Django实现简单分页功能的方法详解
2017/12/05 Python
Python GUI Tkinter简单实现个性签名设计
2018/06/19 Python
Python读取txt内容写入xls格式excel中的方法
2018/10/11 Python
解决Python下json.loads()中文字符出错的问题
2018/12/19 Python
Python类中方法getitem和getattr详解
2019/08/30 Python
Python:合并两个numpy矩阵的实现
2019/12/02 Python
pycharm不以pytest方式运行,想要切换回普通模式运行的操作
2020/09/01 Python
python开发一个解析protobuf文件的简单编译器
2020/11/17 Python
Django搭建项目实战与避坑细节详解
2020/12/06 Python
DRF使用simple JWT身份验证的实现
2021/01/14 Python
德国综合购物网站:OTTO
2018/11/13 全球购物
在DELPHI中调用存储过程和使用内嵌SQL哪种方式更好
2016/11/22 面试题
信用社竞聘演讲稿
2014/05/16 职场文书
教师一帮一活动总结
2014/07/08 职场文书
纪念九一八事变演讲稿:牢记历史,捍卫主权
2014/09/14 职场文书
农村文化建设标语
2014/10/07 职场文书
出差报告范文
2014/11/06 职场文书
展览会邀请函
2015/02/02 职场文书
预备党员半年考察意见
2015/06/01 职场文书
教你怎么用Python实现多路径迷宫
2021/04/29 Python
MySQL之PXC集群搭建的方法步骤
2021/05/25 MySQL