Python使用Pandas对csv文件进行数据处理的方法


Posted in Python onAugust 01, 2019

今天接到一个新的任务,要对一个140多M的csv文件进行数据处理,总共有170多万行,尝试了导入本地的MySQL数据库进行查询,结果用Navicat导入直接卡死....估计是XAMPP套装里面全默认配置的MySQL性能不给力,又尝试用R搞一下吧结果发现光加载csv文件就要3分钟左右的时间,相当不给力啊,翻了翻万能的知乎发现了Python下的一个神器包:Pandas(熊猫们?),加载这个140多M的csv文件两秒钟就搞定,后面的分类汇总等操作也都是秒开,太牛逼了!记录一下这次数据处理的过程:

使用Python3.6.4环境(对中文支持比较好),安装Pandas包

pip install pandas

基本使用:

import pandas as pd
import numpy as np #进行具体的sum,count等计算时候要用到的
df=pd.read_csv('d:/snp/nh23.csv') #这里绝对路径一定要用/,windows下也是如此,不加参数默认csv文件首行为标题行
df.head() #查看引入的csv文件前5行数据
df[“播种面积”] #查看指定列,后面跟[:5]查看前5行数据

Python使用Pandas对csv文件进行数据处理的方法

df[“调查对象代码”].str[:6] #获取指定列前6位字符串

df["ADDR"]=df["调查对象代码"].str[:6] #将上一行处理后的6位地址码作为新列ADDR插入

Python使用Pandas对csv文件进行数据处理的方法

gp=df.groupby(["ADDR","代码"])["播种面积"].sum() #根据ADDR和代码进行分组后对播种面积列进行sum求和计算

Python使用Pandas对csv文件进行数据处理的方法

pv=df.pivot_table(["播种面积"],index="ADDR",columns="代码",margins=True,aggfunc=np.sum,fill_value=0) #数据透视图,对播种面积列进行汇总计算,index为行,columns为列,margins=True增加一个全部行汇总,aggfunc=np.sum透视图中对播种面积值进行sum计算,这里np是开头import的numpy as np,fill_value=0对空值进行0替换,否则没有数据会显示NaN

Python使用Pandas对csv文件进行数据处理的方法

pv.to_csv("d:/snp/test.csv") #写入csv文件

总结

以上所述是小编给大家介绍的Python使用Pandas对csv文件进行数据处理的方法,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对三水点靠木网站的支持!
如果你觉得本文对你有帮助,欢迎转载,烦请注明出处,谢谢!

Python 相关文章推荐
python3使用PyMysql连接mysql数据库实例
Feb 07 Python
Python实现学生成绩管理系统
Apr 05 Python
python 2.7.14安装图文教程
Apr 08 Python
Python(TensorFlow框架)实现手写数字识别系统的方法
May 29 Python
python变量赋值方法(可变与不可变)
Jan 12 Python
详解【python】str与json类型转换
Apr 29 Python
python如何实现数据的线性拟合
Jul 19 Python
python列表推导和生成器表达式知识点总结
Jan 10 Python
Python3 io文本及原始流I/O工具用法详解
Mar 23 Python
在tensorflow以及keras安装目录查询操作(windows下)
Jun 19 Python
python request 模块详细介绍
Nov 10 Python
python requests库的使用
Jan 06 Python
python使用writerows写csv文件产生多余空行的处理方法
Aug 01 #Python
python psutil模块使用方法解析
Aug 01 #Python
python读写csv文件并增加行列的实例代码
Aug 01 #Python
Flask框架重定向,错误显示,Responses响应及Sessions会话操作示例
Aug 01 #Python
python对csv文件追加写入列的方法
Aug 01 #Python
Django Aggregation聚合使用方法解析
Aug 01 #Python
Flask教程之重定向与错误处理实例分析
Aug 01 #Python
You might like
用PHP和ACCESS写聊天室(二)
2006/10/09 PHP
PHP 配置open_basedir 让各虚拟站点独立运行
2009/11/12 PHP
php eval函数用法总结
2012/10/31 PHP
PHP中创建和验证哈希的简单方法实探
2015/07/06 PHP
javascript 计算两个整数的百分比值
2009/12/26 Javascript
动态加载图片路径 保持JavaScript控件的相对独立性
2010/09/06 Javascript
javascript获得服务器端控件的ID的实现代码
2011/12/28 Javascript
JSP中使用JavaScript动态插入删除输入框实现代码
2014/06/13 Javascript
nodejs事件的监听与触发的理解分析
2015/02/12 NodeJs
jquery中添加属性和删除属性
2015/06/03 Javascript
javascript学习之json入门
2016/12/22 Javascript
利用node.js写一个爬取知乎妹纸图的小爬虫
2017/05/03 Javascript
JS移动端/H5同时选择多张图片上传并使用canvas压缩图片
2017/06/20 Javascript
Angularjs cookie 操作实例详解
2017/09/27 Javascript
Promise.all中对于reject的处理方法
2018/08/01 Javascript
vue刷新页面时去闪烁提升用户体验效果的实现方法
2018/12/10 Javascript
layui 数据表格 点击分页按钮 监听事件的实例
2019/09/02 Javascript
Layer+Echarts构建弹出层折线图的方法
2019/09/25 Javascript
在Python中操作列表之List.pop()方法的使用
2015/05/21 Python
用Python写一个无界面的2048小游戏
2016/05/24 Python
详解python里使用正则表达式的分组命名方式
2017/10/24 Python
Python列表推导式、字典推导式与集合推导式用法实例分析
2018/02/07 Python
浅析python继承与多重继承
2018/09/13 Python
Python数据集切分实例
2018/12/08 Python
Python函数返回不定数量的值方法
2019/01/22 Python
对Python 中矩阵或者数组相减的法则详解
2019/08/26 Python
pytorch 自定义参数不更新方式
2020/01/06 Python
Tensorflow训练模型越来越慢的2种解决方案
2020/02/07 Python
Django websocket原理及功能实现代码
2020/11/14 Python
详解如何用HTML5 Canvas API控制图片的缩放变换
2016/03/22 HTML / CSS
各营销点岗位职责范本
2014/03/05 职场文书
春季防火方案
2014/05/10 职场文书
音乐节策划方案
2014/06/09 职场文书
倡议书格式
2014/08/30 职场文书
好员工观后感
2015/06/17 职场文书
90条交通安全宣传标语
2019/10/12 职场文书