pandas去重复行并分类汇总的实现方法


Posted in Python onJanuary 29, 2019

今天主要记录一下pandas去重复行以及如何分类汇总。以下面的数据帧作为一个例子: 

import pandas as pd
data=pd.DataFrame({'产品':['A','A','A','A'],'数量':[50,50,30,30]})

pandas判断dataframe是否含有重复行数据用:df.duplicated()

pandas去重复行并分类汇总的实现方法

 第一次出现的数据为False.重复的数据行就被记录为True。

去掉重复行数据使用data.drop_duplicates().

pandas去重复行并分类汇总的实现方法

 可以看到索引乱了,我们使用data.reset_index(),里面的参数drop=True,表明要舍掉原来的索引,不然的话原来的索引会保留下来。

pandas去重复行并分类汇总的实现方法

 分类汇总主要使用groupby(表明汇总的条件列)以及agg(要汇总的字段/列以及汇总的方式:求和还是最大最小值或者计数)。完整代码如下图

# -*- coding: utf-8 -*-
"""
Created on Fri Jul 20 09:08:10 2018
@author: FanXiaoLei
"""
import pandas as pd
data=pd.DataFrame({'产品':['A','A','A','A'],'数量':[50,50,30,30]})
if data.duplicated:
  dataA=data.drop_duplicates().reset_index(drop=True)
print(dataA)
dataB=dataA.groupby(by='产品').agg({'数量':sum})
print('数据汇总结果:')
print(dataB)

结果展示如下图:

pandas去重复行并分类汇总的实现方法

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python实现rest请求api示例
Apr 22 Python
Python代码的打包与发布详解
Jul 30 Python
python实现批量修改文件名代码
Sep 10 Python
Python实现的基数排序算法原理与用法实例分析
Nov 23 Python
tensorflow 打印内存中的变量方法
Jul 30 Python
Python补齐字符串长度的实例
Nov 15 Python
Python 动态导入对象,importlib.import_module()的使用方法
Aug 28 Python
使用python实现画AR模型时序图
Nov 20 Python
Python进程的通信Queue、Pipe实例分析
Mar 30 Python
一文轻松掌握python语言命名规范规则
Jun 18 Python
利用python 下载bilibili视频
Nov 13 Python
Python 文本滚动播放器的实现代码
Apr 25 Python
spark dataframe 将一列展开,把该列所有值都变成新列的方法
Jan 29 #Python
Python使用ctypes调用C/C++的方法
Jan 29 #Python
dataframe 按条件替换某一列中的值方法
Jan 29 #Python
Numpy之random函数使用学习
Jan 29 #Python
pandas DataFrame 删除重复的行的实现方法
Jan 29 #Python
使用Python向DataFrame中指定位置添加一列或多列的方法
Jan 29 #Python
Python Pexpect库的简单使用方法
Jan 29 #Python
You might like
谈谈新手如何学习PHP
2006/12/23 PHP
php curl 伪造IP来源的实例代码
2012/11/01 PHP
php获取文件夹路径内的图片以及分页显示示例
2014/03/11 PHP
PHP对文件夹递归执行chmod命令的方法
2015/06/19 PHP
php实现简单的上传进度条
2015/11/17 PHP
PHP浮点比较大小的方法
2016/02/14 PHP
PHP递归实现层级树状展开
2016/04/01 PHP
Laravel实现批量更新多条数据
2020/04/06 PHP
图片按比例缩放函数
2006/06/26 Javascript
让广告代码不再影响你的网页加载速度
2006/07/07 Javascript
JS图片无缝滚动(简单利于使用)
2013/06/17 Javascript
Jquery 实现表格颜色交替变化鼠标移过颜色变化实例
2013/08/28 Javascript
JSP跨iframe如何传递参数实现代码
2013/09/21 Javascript
ExtJS中设置下拉列表框不可编辑的方法
2014/05/07 Javascript
js读取csv文件并使用json显示出来
2015/01/09 Javascript
微信小程序 教程之引用
2016/10/18 Javascript
js与jquery分别实现tab标签页功能的方法
2016/11/18 Javascript
AngularJs 终极购物车(实例讲解)
2017/11/08 Javascript
jQuery实现验证表单密码一致性及正则表达式验证邮箱、手机号的方法
2017/12/05 jQuery
JavaScript实现图片合成下载的示例
2020/11/19 Javascript
[43:41]OG vs Newbee 2019国际邀请赛淘汰赛 胜者组 BO3 第一场 8.21.mp4
2020/07/19 DOTA
[04:15]DOTA2-DPC中国联赛 正赛 Ehome vs Aster 选手采访
2021/03/11 DOTA
极简的Python入门指引
2015/04/01 Python
Python中的random()方法的使用介绍
2015/05/15 Python
Python cx_freeze打包工具处理问题思路及解决办法
2016/02/13 Python
python实现维吉尼亚加密法
2019/03/20 Python
pandas DataFrame 警告(SettingWithCopyWarning)的解决
2019/07/23 Python
详解在Python中以绝对路径或者相对路径导入文件的方法
2019/08/30 Python
使用pandas的box_plot去除异常值
2019/12/10 Python
Python函数参数分类原理详解
2020/05/28 Python
英国性能汽车零件和发动机配件在线:Maxpeedingrods
2019/11/05 全球购物
党员学习党的群众路线思想汇报(5篇)
2014/09/10 职场文书
机关驾驶员违规检讨书
2014/09/13 职场文书
2014年工程部工作总结
2014/11/25 职场文书
学校食堂管理制度
2015/08/04 职场文书
简单聊聊TypeScript只读修饰符
2022/04/06 Javascript