Python使用pandas处理CSV文件的实例讲解


Posted in Python onJune 22, 2018

Python中有许多方便的库可以用来进行数据处理,尤其是Numpy和Pandas,再搭配matplot画图专用模块,功能十分强大。

CSV(Comma-Separated Values)格式的文件是指以纯文本形式存储的表格数据,这意味着不能简单的使用Excel表格工具进行处理,而且Excel表格处理的数据量十分有限,而使用Pandas来处理数据量巨大的CSV文件就容易的多了。

我用到的是自己用其他硬件工具抓取得数据,硬件环境是在Linux平台上搭建的,当时数据是在运行脚本后直接输出在terminal里的,数据量十分庞大,为了保存获得的数据,在Linux下使用了数据流重定向,把数据全部保存到了文本文件中,形成了一个本地csv文件。

Pandas读取本地CSV文件并设置Dataframe(数据格式)

import pandas as pd
import numpy as np
df=pd.read_csv('filename',header=None,sep=' ') #filename可以直接从盘符开始,标明每一级的文件夹直到csv文件,header=None表示头部为空,sep=' '表示数据间使用空格作为分隔符,如果分隔符是逗号,只需换成 ‘,'即可。
print df.head()
print df.tail()
#作为示例,输出CSV文件的前5行和最后5行,这是pandas默认的输出5行,可以根据需要自己设定输出几行的值

Python使用pandas处理CSV文件的实例讲解

数据读取示例

图片中显示了我本地数据的前5行与最后5行,最前面一列没有标号的是行号,数据一共有13列,标号从0到12,一行显示不完全,在第9列以后换了行,并且用反斜杠“\”标注了出来。

2017年4月28日更新

使用pandas直接读取本地的csv文件后,csv文件的列索引默认为从0开始的数字,重定义列索引的语句如下:

import pandas as pd
import numpy as np
df=pd.read_csv('filename',header=None,sep=' ',names=["week",'month','date','time','year','name1','freq1','name2','freq2','name3','data1','name4','data2'])
print df

此时打印出的文件信息如下,列索引已经被重命名:

Python使用pandas处理CSV文件的实例讲解

以上这篇Python使用pandas处理CSV文件的实例讲解就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python 动态获取当前运行的类名和函数名的方法
Apr 15 Python
Python实现同时兼容老版和新版Socket协议的一个简单WebSocket服务器
Jun 04 Python
小结Python用fork来创建子进程注意事项
Jul 03 Python
python基础教程之对象和类的实际运用
Aug 29 Python
Python代码缩进和测试模块示例详解
May 07 Python
python实现超简单的视频对象提取功能
Jun 04 Python
flask入门之表单的实现
Jul 18 Python
python自动点赞功能的实现思路
Feb 26 Python
Python键鼠操作自动化库PyAutoGUI简介(小结)
May 17 Python
Python常用数字处理基本操作汇总
Sep 10 Python
python用分数表示矩阵的方法实例
Jan 11 Python
python使用torch随机初始化参数
Mar 22 Python
python处理csv中的空值方法
Jun 22 #Python
Python实现base64编码的图片保存到本地功能示例
Jun 22 #Python
关于python2 csv写入空白行的问题
Jun 22 #Python
浅谈Python2、Python3相对路径、绝对路径导入方法
Jun 22 #Python
Python基于pandas实现json格式转换成dataframe的方法
Jun 22 #Python
深入浅析Python的类
Jun 22 #Python
基于python绘制科赫雪花
Jun 22 #Python
You might like
Smarty中调用FCKeditor的方法
2014/10/27 PHP
php使用mysqli向数据库添加数据的方法
2015/03/20 PHP
PHP的垃圾回收机制代码实例讲解
2021/02/27 PHP
jquery $(this).attr $(this).val方法使用介绍
2013/10/08 Javascript
使用javascript实现Iframe自适应高度
2014/12/24 Javascript
浅谈JavaScript正则表达式分组匹配
2015/04/10 Javascript
Angular 根据 service 的状态更新 directive
2016/04/03 Javascript
vue.js实现用户评论、登录、注册、及修改信息功能
2020/05/30 Javascript
angularjs封装$http为factory的方法
2017/05/18 Javascript
JS鼠标滚动分页效果示例
2017/07/05 Javascript
Angular X中使用ngrx的方法详解(附源码)
2017/07/10 Javascript
利用Javascript实现一套自定义事件机制
2017/12/14 Javascript
JS获取input[file]的值并显示在页面的实现方法
2018/03/09 Javascript
vue首次赋值不触发watch的解决方法
2018/09/11 Javascript
vue二级菜单导航点击选中事件的方法
2018/09/12 Javascript
新手入门带你学习JavaScript引擎运行原理
2019/06/24 Javascript
JS插入排序简单理解与实现方法分析
2019/11/25 Javascript
JavaScript实现简单动态表格
2020/12/02 Javascript
Python 给某个文件名添加时间戳的方法
2018/10/16 Python
使用python Fabric动态修改远程机器hosts的方法
2018/10/26 Python
Python使用sqlalchemy模块连接数据库操作示例
2019/03/13 Python
基于python 凸包问题的解决
2020/04/16 Python
10个python爬虫入门基础代码实例 + 1个简单的python爬虫完整实例
2020/12/16 Python
中外合拍动画首获奥斯卡提名,“上海出品”《飞奔去月球》能否拿下最终大奖?
2021/03/16 国漫
高分子材料与工程专业个人求职信
2013/12/15 职场文书
清华大学自主招生自荐信
2014/01/29 职场文书
小学新教师培训方案
2014/02/03 职场文书
幼儿园毕业寄语
2014/04/03 职场文书
导航工程专业自荐信
2014/09/02 职场文书
见习报告的格式
2014/11/04 职场文书
给女朋友的道歉短信
2015/05/12 职场文书
同意转租证明
2015/06/24 职场文书
2015年小学教师培训工作总结
2015/07/21 职场文书
2015年物业公司保洁工作总结
2015/10/22 职场文书
原生JS封装vue Tab切换效果
2021/04/28 Vue.js
关于redisson缓存序列化几枚大坑说明
2021/08/04 Redis