pandas去重复行并分类汇总的实现方法


Posted in Python onJanuary 29, 2019

今天主要记录一下pandas去重复行以及如何分类汇总。以下面的数据帧作为一个例子: 

import pandas as pd
data=pd.DataFrame({'产品':['A','A','A','A'],'数量':[50,50,30,30]})

pandas判断dataframe是否含有重复行数据用:df.duplicated()

pandas去重复行并分类汇总的实现方法

 第一次出现的数据为False.重复的数据行就被记录为True。

去掉重复行数据使用data.drop_duplicates().

pandas去重复行并分类汇总的实现方法

 可以看到索引乱了,我们使用data.reset_index(),里面的参数drop=True,表明要舍掉原来的索引,不然的话原来的索引会保留下来。

pandas去重复行并分类汇总的实现方法

 分类汇总主要使用groupby(表明汇总的条件列)以及agg(要汇总的字段/列以及汇总的方式:求和还是最大最小值或者计数)。完整代码如下图

# -*- coding: utf-8 -*-
"""
Created on Fri Jul 20 09:08:10 2018
@author: FanXiaoLei
"""
import pandas as pd
data=pd.DataFrame({'产品':['A','A','A','A'],'数量':[50,50,30,30]})
if data.duplicated:
  dataA=data.drop_duplicates().reset_index(drop=True)
print(dataA)
dataB=dataA.groupby(by='产品').agg({'数量':sum})
print('数据汇总结果:')
print(dataB)

结果展示如下图:

pandas去重复行并分类汇总的实现方法

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python中的fileinput模块的简单实用示例
Jul 09 Python
Python简单检测文本类型的2种方法【基于文件头及cchardet库】
Sep 18 Python
Django基础之Model操作步骤(介绍)
May 27 Python
Python编程中NotImplementedError的使用方法
Apr 21 Python
Python3多线程操作简单示例
May 22 Python
python 保存float类型的小数的位数方法
Oct 17 Python
Python分支语句与循环语句应用实例分析
May 07 Python
python将字母转化为数字实例方法
Oct 04 Python
python编写微信公众号首图思路详解
Dec 13 Python
PyCharm+PyQt5+QtDesigner配置详解
Aug 12 Python
python os.listdir()乱码解决方案
Jan 31 Python
python 命令行传参方法总结
May 25 Python
spark dataframe 将一列展开,把该列所有值都变成新列的方法
Jan 29 #Python
Python使用ctypes调用C/C++的方法
Jan 29 #Python
dataframe 按条件替换某一列中的值方法
Jan 29 #Python
Numpy之random函数使用学习
Jan 29 #Python
pandas DataFrame 删除重复的行的实现方法
Jan 29 #Python
使用Python向DataFrame中指定位置添加一列或多列的方法
Jan 29 #Python
Python Pexpect库的简单使用方法
Jan 29 #Python
You might like
PHP中如何实现常用邮箱的基本判断
2014/01/07 PHP
PHP转换文本框内容为HTML格式的方法
2016/07/20 PHP
PHP设计模式之策略模式原理与用法实例分析
2019/04/04 PHP
jquery 最简单的属性菜单
2009/10/08 Javascript
jquery 选项卡效果 新手代码
2011/07/08 Javascript
线路分流自动智能跳转代码,自动选择最快镜像网站(js)
2011/10/31 Javascript
JavaScript地图拖动功能SpryMap的简单实现
2013/07/17 Javascript
深入解读JavaScript中的Hoisting机制
2015/08/12 Javascript
TinyMCE汉化及本地上传图片功能实例详解
2016/05/31 Javascript
js中json处理总结之JSON.parse
2016/10/14 Javascript
js+css3制作时钟特效
2016/10/16 Javascript
详解Angualr 组件间通信
2017/01/21 Javascript
利用Javascript实现简单的转盘抽奖
2017/02/13 Javascript
轻松理解vue的双向数据绑定问题
2017/10/30 Javascript
详解如何将 Vue-cli 改造成支持多页面的 history 模式
2017/11/20 Javascript
JS实现用特殊符号替换字符串的中间部分区域的实例代码
2018/07/24 Javascript
JS中注入eval, Function等系统函数截获动态代码
2019/04/03 Javascript
Angular 中使用 FineReport不显示报表直接打印预览
2019/08/21 Javascript
JavaScript Image对象实现原理实例解析
2020/08/26 Javascript
Python面向对象之类和对象实例详解
2018/12/10 Python
用Python实现大文本文件切割的方法
2019/01/12 Python
python pandas 时间日期的处理实现
2019/07/30 Python
Pytorch 实现自定义参数层的例子
2019/08/17 Python
基于python调用psutil模块过程解析
2019/12/20 Python
CSS3圆角和渐变2种常用功能详解
2016/01/06 HTML / CSS
女性时尚网购:Chic Me
2019/07/30 全球购物
Vans澳大利亚官网:购买鞋子、服装及配件
2019/09/05 全球购物
Sisley法国希思黎美国官方网站:享誉全球的奢华植物美容品牌
2020/06/27 全球购物
药剂学专业应届生自荐信
2013/09/29 职场文书
写给保洁员表扬信
2014/01/08 职场文书
小学一年级学生评语
2014/04/22 职场文书
个人主要事迹材料
2014/08/26 职场文书
质量整改通知单
2015/04/21 职场文书
讲座开场白台词和结束语
2015/05/29 职场文书
小英雄雨来观后感
2015/06/09 职场文书
基于redis+lua进行限流的方法
2022/07/23 Redis