Python使用pandas处理CSV文件的实例讲解


Posted in Python onJune 22, 2018

Python中有许多方便的库可以用来进行数据处理,尤其是Numpy和Pandas,再搭配matplot画图专用模块,功能十分强大。

CSV(Comma-Separated Values)格式的文件是指以纯文本形式存储的表格数据,这意味着不能简单的使用Excel表格工具进行处理,而且Excel表格处理的数据量十分有限,而使用Pandas来处理数据量巨大的CSV文件就容易的多了。

我用到的是自己用其他硬件工具抓取得数据,硬件环境是在Linux平台上搭建的,当时数据是在运行脚本后直接输出在terminal里的,数据量十分庞大,为了保存获得的数据,在Linux下使用了数据流重定向,把数据全部保存到了文本文件中,形成了一个本地csv文件。

Pandas读取本地CSV文件并设置Dataframe(数据格式)

import pandas as pd
import numpy as np
df=pd.read_csv('filename',header=None,sep=' ') #filename可以直接从盘符开始,标明每一级的文件夹直到csv文件,header=None表示头部为空,sep=' '表示数据间使用空格作为分隔符,如果分隔符是逗号,只需换成 ‘,'即可。
print df.head()
print df.tail()
#作为示例,输出CSV文件的前5行和最后5行,这是pandas默认的输出5行,可以根据需要自己设定输出几行的值

Python使用pandas处理CSV文件的实例讲解

数据读取示例

图片中显示了我本地数据的前5行与最后5行,最前面一列没有标号的是行号,数据一共有13列,标号从0到12,一行显示不完全,在第9列以后换了行,并且用反斜杠“\”标注了出来。

2017年4月28日更新

使用pandas直接读取本地的csv文件后,csv文件的列索引默认为从0开始的数字,重定义列索引的语句如下:

import pandas as pd
import numpy as np
df=pd.read_csv('filename',header=None,sep=' ',names=["week",'month','date','time','year','name1','freq1','name2','freq2','name3','data1','name4','data2'])
print df

此时打印出的文件信息如下,列索引已经被重命名:

Python使用pandas处理CSV文件的实例讲解

以上这篇Python使用pandas处理CSV文件的实例讲解就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python实现的udp协议Server和Client代码实例
Jun 04 Python
跟老齐学Python之集合(set)
Sep 24 Python
教你用python3根据关键词爬取百度百科的内容
Aug 18 Python
20个常用Python运维库和模块
Feb 12 Python
python安装教程
Feb 28 Python
Python Web框架之Django框架Form组件用法详解
Aug 16 Python
pytorch中nn.Conv1d的用法详解
Dec 31 Python
python 函数中的参数类型
Feb 11 Python
Python中使用filter过滤列表的一个小技巧分享
May 02 Python
Python字典取键、值对的方法步骤
Sep 30 Python
python中的列表和元组区别分析
Dec 30 Python
python3 kubernetes api的使用示例
Jan 12 Python
python处理csv中的空值方法
Jun 22 #Python
Python实现base64编码的图片保存到本地功能示例
Jun 22 #Python
关于python2 csv写入空白行的问题
Jun 22 #Python
浅谈Python2、Python3相对路径、绝对路径导入方法
Jun 22 #Python
Python基于pandas实现json格式转换成dataframe的方法
Jun 22 #Python
深入浅析Python的类
Jun 22 #Python
基于python绘制科赫雪花
Jun 22 #Python
You might like
第十节 抽象方法和抽象类 [10]
2006/10/09 PHP
THINKPHP项目开发中的日志记录实例分析
2014/12/01 PHP
列举PHP的Yii 2框架的开发优势
2015/07/03 PHP
PHP的自定义模板引擎
2017/03/24 PHP
php 广告点击统计代码(php+mysql)
2018/02/21 PHP
JScript中的"this"关键字使用方式补充材料
2007/03/08 Javascript
复制Input内容的js代码_支持所有浏览器,修正了Firefox3.5以上的问题
2010/06/21 Javascript
通过JS来判断页面控件是否获取焦点
2014/01/03 Javascript
网站接入QQ登录的两种方法
2014/07/22 Javascript
JavaScript实现在标题栏上显示当前日期的方法
2015/03/19 Javascript
JS简单获取及显示当前时间的方法
2016/08/03 Javascript
表单元素值获取方式js及java方式的简单实例
2016/10/15 Javascript
EasyUI Datebox 日期验证之开始日期小于结束时间
2017/05/19 Javascript
浅谈sass在vue注意的地方
2017/08/10 Javascript
Node.js使用MongoDB的ObjectId作为查询条件的方法
2019/09/10 Javascript
详解Angular cli配置过程记录
2019/11/07 Javascript
微信小程序实现上传多个文件 超过10个
2020/03/30 Javascript
Vue看了就会的8个小技巧
2021/01/21 Vue.js
Python爬虫框架Scrapy安装使用步骤
2014/04/01 Python
使用Python获取CPU、内存和硬盘等windowns系统信息的2个例子
2014/04/15 Python
Python中max函数用法实例分析
2015/07/17 Python
详谈Pandas中iloc和loc以及ix的区别
2018/06/08 Python
Python数据抓取爬虫代理防封IP方法
2018/12/23 Python
python IDLE 背景以及字体大小的修改方法
2019/07/12 Python
python实现批量nii文件转换为png图像
2019/07/18 Python
修改 CentOS 6.x 上默认Python的方法
2019/09/06 Python
世界上最大的售后摩托车零配件超市:J&P Cycles
2017/12/08 全球购物
计算机专业自我鉴定
2013/10/15 职场文书
违纪检讨书2000字
2014/02/08 职场文书
论文指导教师评语
2014/04/28 职场文书
学校校庆演讲稿
2014/05/22 职场文书
党员干部对十八届四中全会的期盼
2014/10/17 职场文书
自愿离婚协议书范本2016
2016/03/18 职场文书
Windows安装Anaconda3的方法及使用过程详解
2021/06/11 Python
Python实现随机生成迷宫并自动寻路
2021/06/13 Python
MySQL中几种插入和批量语句实例详解
2021/09/14 MySQL