Python使用pandas处理CSV文件的实例讲解


Posted in Python onJune 22, 2018

Python中有许多方便的库可以用来进行数据处理,尤其是Numpy和Pandas,再搭配matplot画图专用模块,功能十分强大。

CSV(Comma-Separated Values)格式的文件是指以纯文本形式存储的表格数据,这意味着不能简单的使用Excel表格工具进行处理,而且Excel表格处理的数据量十分有限,而使用Pandas来处理数据量巨大的CSV文件就容易的多了。

我用到的是自己用其他硬件工具抓取得数据,硬件环境是在Linux平台上搭建的,当时数据是在运行脚本后直接输出在terminal里的,数据量十分庞大,为了保存获得的数据,在Linux下使用了数据流重定向,把数据全部保存到了文本文件中,形成了一个本地csv文件。

Pandas读取本地CSV文件并设置Dataframe(数据格式)

import pandas as pd
import numpy as np
df=pd.read_csv('filename',header=None,sep=' ') #filename可以直接从盘符开始,标明每一级的文件夹直到csv文件,header=None表示头部为空,sep=' '表示数据间使用空格作为分隔符,如果分隔符是逗号,只需换成 ‘,'即可。
print df.head()
print df.tail()
#作为示例,输出CSV文件的前5行和最后5行,这是pandas默认的输出5行,可以根据需要自己设定输出几行的值

Python使用pandas处理CSV文件的实例讲解

数据读取示例

图片中显示了我本地数据的前5行与最后5行,最前面一列没有标号的是行号,数据一共有13列,标号从0到12,一行显示不完全,在第9列以后换了行,并且用反斜杠“\”标注了出来。

2017年4月28日更新

使用pandas直接读取本地的csv文件后,csv文件的列索引默认为从0开始的数字,重定义列索引的语句如下:

import pandas as pd
import numpy as np
df=pd.read_csv('filename',header=None,sep=' ',names=["week",'month','date','time','year','name1','freq1','name2','freq2','name3','data1','name4','data2'])
print df

此时打印出的文件信息如下,列索引已经被重命名:

Python使用pandas处理CSV文件的实例讲解

以上这篇Python使用pandas处理CSV文件的实例讲解就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python HTMLParser模块解析html获取url实例
Apr 08 Python
Python模块搜索概念介绍及模块安装方法介绍
Jun 03 Python
开源Web应用框架Django图文教程
Mar 09 Python
用python爬取租房网站信息的代码
Dec 14 Python
简单了解python协程的相关知识
Aug 31 Python
使用Python进行中文繁简转换的实现代码
Oct 18 Python
Python安装依赖(包)模块方法详解
Feb 14 Python
pycharm激活方法到2099年(激活流程)
Sep 22 Python
安装并免费使用Pycharm专业版(学生/教师)
Sep 24 Python
利用python清除移动硬盘中的临时文件
Oct 28 Python
python保存大型 .mat 数据文件报错超出 IO 限制的操作
May 10 Python
pyqt5蒙版遮罩mask,setmask的使用
Jun 11 Python
python处理csv中的空值方法
Jun 22 #Python
Python实现base64编码的图片保存到本地功能示例
Jun 22 #Python
关于python2 csv写入空白行的问题
Jun 22 #Python
浅谈Python2、Python3相对路径、绝对路径导入方法
Jun 22 #Python
Python基于pandas实现json格式转换成dataframe的方法
Jun 22 #Python
深入浅析Python的类
Jun 22 #Python
基于python绘制科赫雪花
Jun 22 #Python
You might like
php计算两个坐标(经度,纬度)之间距离的方法
2015/04/17 PHP
php 调用ffmpeg获取视频信息的简单实现
2017/04/03 PHP
在php的yii2框架中整合hbase库的方法
2018/09/20 PHP
通用于ie和firefox的函数 GetCurrentStyle (obj, prop)
2006/12/27 Javascript
javascript自动给文本url地址增加链接的方法分享
2014/01/20 Javascript
jQuery实现的原图对比窗帘效果
2014/06/15 Javascript
实例讲解JQuery中this和$(this)区别
2014/12/08 Javascript
javascript日期处理函数,性能优化批处理
2015/09/06 Javascript
jQuery插件EasyUI实现Layout框架页面中弹出窗体到最顶层效果(穿越iframe)
2016/08/05 Javascript
JS对大量数据进行多重过滤的方法
2016/11/04 Javascript
jquery购物车结算功能实现方法
2020/10/29 Javascript
详解js数组的完全随机排列算法
2016/12/16 Javascript
Jquery Easyui搜索框组件SearchBox使用详解(19)
2016/12/17 Javascript
微信小程序自定义模态对话框实例详解
2017/08/16 Javascript
js页面加载后执行的几种方式小结
2020/01/30 Javascript
jquery实现有过渡效果的tab切换
2020/07/17 jQuery
vue任意关系组件通信与跨组件监听状态vue-communication
2020/10/18 Javascript
微信小程序input抖动问题的修复方法
2021/03/03 Javascript
Python logging模块学习笔记
2014/05/24 Python
Python 内置函数complex详解
2016/10/23 Python
CentOS中升级Python版本的方法详解
2017/07/10 Python
Python+matplotlib实现华丽的文本框演示代码
2018/01/22 Python
浅谈Python Opencv中gamma变换的使用详解
2018/04/02 Python
对numpy中二进制格式的数据存储与读取方法详解
2018/11/01 Python
python excel转换csv代码实例
2019/08/26 Python
详解HTML5中的标签
2015/06/19 HTML / CSS
原装进口全世界:天猫国际
2016/08/03 全球购物
7 For All Mankind官网:美国加州洛杉矶的高级牛仔服装品牌
2018/12/20 全球购物
中国梦的演讲稿
2014/01/08 职场文书
承诺书范文
2014/06/03 职场文书
2014幼儿园大班工作总结
2014/11/10 职场文书
中班教师个人总结
2015/02/05 职场文书
Nginx解决403 forbidden的完整步骤
2021/04/01 Servers
MySQL查看表和清空表的常用命令总结
2021/05/26 MySQL
js实现自动锁屏功能
2021/06/02 Javascript
python实现双链表
2022/05/25 Python