pandas去重复行并分类汇总的实现方法


Posted in Python onJanuary 29, 2019

今天主要记录一下pandas去重复行以及如何分类汇总。以下面的数据帧作为一个例子: 

import pandas as pd
data=pd.DataFrame({'产品':['A','A','A','A'],'数量':[50,50,30,30]})

pandas判断dataframe是否含有重复行数据用:df.duplicated()

pandas去重复行并分类汇总的实现方法

 第一次出现的数据为False.重复的数据行就被记录为True。

去掉重复行数据使用data.drop_duplicates().

pandas去重复行并分类汇总的实现方法

 可以看到索引乱了,我们使用data.reset_index(),里面的参数drop=True,表明要舍掉原来的索引,不然的话原来的索引会保留下来。

pandas去重复行并分类汇总的实现方法

 分类汇总主要使用groupby(表明汇总的条件列)以及agg(要汇总的字段/列以及汇总的方式:求和还是最大最小值或者计数)。完整代码如下图

# -*- coding: utf-8 -*-
"""
Created on Fri Jul 20 09:08:10 2018
@author: FanXiaoLei
"""
import pandas as pd
data=pd.DataFrame({'产品':['A','A','A','A'],'数量':[50,50,30,30]})
if data.duplicated:
  dataA=data.drop_duplicates().reset_index(drop=True)
print(dataA)
dataB=dataA.groupby(by='产品').agg({'数量':sum})
print('数据汇总结果:')
print(dataB)

结果展示如下图:

pandas去重复行并分类汇总的实现方法

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
用实例分析Python中method的参数传递过程
Apr 02 Python
python中__call__内置函数用法实例
Jun 04 Python
python实现傅里叶级数展开的实现
Jul 21 Python
利用Python实现手机短信监控通知的方法
Jul 22 Python
python redis连接 有序集合去重的代码
Aug 04 Python
使用Python的datetime库处理时间(RPA流程)
Nov 24 Python
Python timer定时器两种常用方法解析
Jan 20 Python
Python递归及尾递归优化操作实例分析
Feb 01 Python
对Matlab中共轭、转置和共轭装置的区别说明
May 11 Python
使用Python构造hive insert语句说明
Jun 06 Python
python3.4中清屏的处理方法
Jul 06 Python
python statsmodel的使用
Dec 21 Python
spark dataframe 将一列展开,把该列所有值都变成新列的方法
Jan 29 #Python
Python使用ctypes调用C/C++的方法
Jan 29 #Python
dataframe 按条件替换某一列中的值方法
Jan 29 #Python
Numpy之random函数使用学习
Jan 29 #Python
pandas DataFrame 删除重复的行的实现方法
Jan 29 #Python
使用Python向DataFrame中指定位置添加一列或多列的方法
Jan 29 #Python
Python Pexpect库的简单使用方法
Jan 29 #Python
You might like
CentOS 6.2使用yum安装LAMP以及phpMyadmin详解
2013/06/17 PHP
php中getservbyport与getservbyname函数用法实例
2014/11/18 PHP
PHP中使用数组指针函数操作数组示例
2014/11/19 PHP
php版微信开发之接收消息,自动判断及回复相应消息的方法
2016/09/23 PHP
jquery 模拟雅虎首页的点击对话框效果
2010/04/11 Javascript
jquery购物车实时结算特效实现思路
2013/09/23 Javascript
js读取注册表的键值示例
2013/09/25 Javascript
非常漂亮的相册集 使用jquery制作相册集
2016/04/28 Javascript
将List对象列表转换成JSON格式的类实现方法
2016/07/04 Javascript
Bootstrap CSS使用方法
2016/12/23 Javascript
如何使用Bootstrap 按钮实例详解
2017/03/29 Javascript
react开发中如何使用require.ensure加载es6风格的组件
2017/05/09 Javascript
详谈DOM简介及节点、属性、查找节点的方法
2017/11/16 Javascript
js实现以最简单的方式将数组元素添加到对象中的方法
2017/12/20 Javascript
使用ajax的post同步执行(实现方法)
2017/12/21 Javascript
vue.js-div滚动条隐藏但有滚动效果的实现方法
2018/03/03 Javascript
详解vue-cli中模拟数据的两种方法
2018/07/03 Javascript
js实现复制粘贴的两种方法
2020/12/04 Javascript
Python 3.x 新特性及10大变化
2015/06/12 Python
Python基础教程之浅拷贝和深拷贝实例详解
2017/07/15 Python
深入探究Django中的Session与Cookie
2017/07/30 Python
Python实现1-9数组形成的结果为100的所有运算式的示例
2017/11/03 Python
Python实现iOS自动化打包详解步骤
2018/10/03 Python
python 堆和优先队列的使用详解
2019/03/05 Python
解决tensorflow读取本地MNITS_data失败的原因
2020/06/22 Python
python如何导入依赖包
2020/07/13 Python
PyCharm 2020.1版安装破解注册码永久激活(激活到2089年)
2020/09/24 Python
京东奢侈品:全球奢侈品牌
2018/03/17 全球购物
Bose加拿大官方网站:美国知名音响品牌
2019/03/21 全球购物
PHP高级工程师面试问题推荐
2013/01/18 面试题
小学生获奖感言范文
2014/02/02 职场文书
工作目标责任书
2014/07/23 职场文书
2014年安全工作总结范文
2014/11/13 职场文书
简历中自我评价范文
2015/03/11 职场文书
小学生班干部竞选稿
2015/11/20 职场文书
2016年学校“6﹒26国际禁毒日”宣传活动总结
2016/04/05 职场文书