Python使用Pandas对csv文件进行数据处理的方法


Posted in Python onAugust 01, 2019

今天接到一个新的任务,要对一个140多M的csv文件进行数据处理,总共有170多万行,尝试了导入本地的MySQL数据库进行查询,结果用Navicat导入直接卡死....估计是XAMPP套装里面全默认配置的MySQL性能不给力,又尝试用R搞一下吧结果发现光加载csv文件就要3分钟左右的时间,相当不给力啊,翻了翻万能的知乎发现了Python下的一个神器包:Pandas(熊猫们?),加载这个140多M的csv文件两秒钟就搞定,后面的分类汇总等操作也都是秒开,太牛逼了!记录一下这次数据处理的过程:

使用Python3.6.4环境(对中文支持比较好),安装Pandas包

pip install pandas

基本使用:

import pandas as pd
import numpy as np #进行具体的sum,count等计算时候要用到的
df=pd.read_csv('d:/snp/nh23.csv') #这里绝对路径一定要用/,windows下也是如此,不加参数默认csv文件首行为标题行
df.head() #查看引入的csv文件前5行数据
df[“播种面积”] #查看指定列,后面跟[:5]查看前5行数据

Python使用Pandas对csv文件进行数据处理的方法

df[“调查对象代码”].str[:6] #获取指定列前6位字符串

df["ADDR"]=df["调查对象代码"].str[:6] #将上一行处理后的6位地址码作为新列ADDR插入

Python使用Pandas对csv文件进行数据处理的方法

gp=df.groupby(["ADDR","代码"])["播种面积"].sum() #根据ADDR和代码进行分组后对播种面积列进行sum求和计算

Python使用Pandas对csv文件进行数据处理的方法

pv=df.pivot_table(["播种面积"],index="ADDR",columns="代码",margins=True,aggfunc=np.sum,fill_value=0) #数据透视图,对播种面积列进行汇总计算,index为行,columns为列,margins=True增加一个全部行汇总,aggfunc=np.sum透视图中对播种面积值进行sum计算,这里np是开头import的numpy as np,fill_value=0对空值进行0替换,否则没有数据会显示NaN

Python使用Pandas对csv文件进行数据处理的方法

pv.to_csv("d:/snp/test.csv") #写入csv文件

总结

以上所述是小编给大家介绍的Python使用Pandas对csv文件进行数据处理的方法,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对三水点靠木网站的支持!
如果你觉得本文对你有帮助,欢迎转载,烦请注明出处,谢谢!

Python 相关文章推荐
python实现带验证码网站的自动登陆实现代码
Jan 12 Python
python使用BeautifulSoup分页网页中超链接的方法
Apr 04 Python
Python设计模式编程中Adapter适配器模式的使用实例
Mar 02 Python
Python 正则表达式的高级用法
Dec 04 Python
简单实现python收发邮件功能
Jan 05 Python
python opencv实现运动检测
Jul 10 Python
Python设计模式之工厂方法模式实例详解
Jan 18 Python
Django实现web端tailf日志文件功能及实例详解
Jul 28 Python
Python Django Vue 项目创建过程详解
Jul 29 Python
python通过链接抓取网站详解
Nov 20 Python
torchxrayvision包安装过程(附pytorch1.6cpu版安装)
Aug 26 Python
Python plt 利用subplot 实现在一张画布同时画多张图
Feb 26 Python
python使用writerows写csv文件产生多余空行的处理方法
Aug 01 #Python
python psutil模块使用方法解析
Aug 01 #Python
python读写csv文件并增加行列的实例代码
Aug 01 #Python
Flask框架重定向,错误显示,Responses响应及Sessions会话操作示例
Aug 01 #Python
python对csv文件追加写入列的方法
Aug 01 #Python
Django Aggregation聚合使用方法解析
Aug 01 #Python
Flask教程之重定向与错误处理实例分析
Aug 01 #Python
You might like
apache2.2.4+mysql5.0.77+php5.2.8安装精简
2009/04/29 PHP
LotusPhp笔记之:基于ObjectUtil组件的使用分析
2013/05/06 PHP
php检查函数必传参数是否存在的实例详解
2017/08/28 PHP
对YUI扩展的Gird组件 Part-2
2007/03/10 Javascript
JS HTML5 音乐天气播放器(Ajax获取天气信息)
2013/05/26 Javascript
jQuery使用andSelf()来包含之前的选择集
2014/05/19 Javascript
Javascript实现的简单右键菜单类
2015/09/23 Javascript
jquery实现可自动判断位置的弹出层效果代码
2015/10/12 Javascript
JS操作JSON方法总结(推荐)
2016/06/14 Javascript
Web安全测试之XSS实例讲解
2016/08/15 Javascript
用jquery获取自定义的标签属性的值简单实例
2016/09/17 Javascript
关于Javascript中defer和async的区别总结
2016/09/20 Javascript
jQuery实用密码强度检测
2017/03/02 Javascript
js array数组对象操作方法汇总
2019/03/18 Javascript
JS算法题之查找数字在数组中的索引位置
2019/05/15 Javascript
element ui分页多选,翻页记忆的实例
2019/09/03 Javascript
全面解析JavaScript Module模式
2020/07/24 Javascript
利用JavaScript模拟京东按键输入功能
2020/12/01 Javascript
通过实例解析js可枚举属性与不可枚举属性
2020/12/02 Javascript
vue调用微信JSDK 扫一扫,相册等需要注意的事项
2021/01/03 Vue.js
Python列表(list)常用操作方法小结
2015/02/02 Python
python 环境变量和import模块导入方法(详解)
2017/07/11 Python
windows环境下tensorflow安装过程详解
2018/03/30 Python
Django框架模板注入操作示例【变量传递到模板】
2018/12/19 Python
Python获取时间戳代码实例
2019/09/24 Python
基于 Python 实践感知器分类算法
2021/01/07 Python
澳大利亚天然护肤品、化妆品和健康产品一站式商店:Nourished Life
2018/12/02 全球购物
澳大利亚买卖正宗二手奢侈品交易平台:Luxe.It.Fwd
2019/10/16 全球购物
生产部经理岗位职责
2013/12/16 职场文书
大二学生职业生涯规划书
2014/02/05 职场文书
开学季活动策划方案
2014/02/28 职场文书
社区消防工作实施方案
2014/03/21 职场文书
2014年信用社工作总结
2014/11/25 职场文书
农村老人去世追悼词
2015/06/23 职场文书
幼儿园大班教师随笔
2015/08/14 职场文书
python语言中pandas字符串分割str.split()函数
2022/08/05 Python