pandas去重复行并分类汇总的实现方法


Posted in Python onJanuary 29, 2019

今天主要记录一下pandas去重复行以及如何分类汇总。以下面的数据帧作为一个例子: 

import pandas as pd
data=pd.DataFrame({'产品':['A','A','A','A'],'数量':[50,50,30,30]})

pandas判断dataframe是否含有重复行数据用:df.duplicated()

pandas去重复行并分类汇总的实现方法

 第一次出现的数据为False.重复的数据行就被记录为True。

去掉重复行数据使用data.drop_duplicates().

pandas去重复行并分类汇总的实现方法

 可以看到索引乱了,我们使用data.reset_index(),里面的参数drop=True,表明要舍掉原来的索引,不然的话原来的索引会保留下来。

pandas去重复行并分类汇总的实现方法

 分类汇总主要使用groupby(表明汇总的条件列)以及agg(要汇总的字段/列以及汇总的方式:求和还是最大最小值或者计数)。完整代码如下图

# -*- coding: utf-8 -*-
"""
Created on Fri Jul 20 09:08:10 2018
@author: FanXiaoLei
"""
import pandas as pd
data=pd.DataFrame({'产品':['A','A','A','A'],'数量':[50,50,30,30]})
if data.duplicated:
  dataA=data.drop_duplicates().reset_index(drop=True)
print(dataA)
dataB=dataA.groupby(by='产品').agg({'数量':sum})
print('数据汇总结果:')
print(dataB)

结果展示如下图:

pandas去重复行并分类汇总的实现方法

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python函数返回值实例分析
Jun 08 Python
Python中map和列表推导效率比较实例分析
Jun 17 Python
python 网络编程常用代码段
Aug 28 Python
python读取与写入csv格式文件的示例代码
Dec 16 Python
python and or用法详解
Jun 26 Python
python 的 scapy库,实现网卡收发包的例子
Jul 23 Python
python超时重新请求解决方案
Oct 21 Python
Python使用Turtle库绘制一棵西兰花
Nov 23 Python
Python SSL证书验证问题解决方案
Jan 13 Python
sklearn线性逻辑回归和非线性逻辑回归的实现
Jun 09 Python
使用Python中tkinter库简单gui界面制作及打包成exe的操作方法(二)
Oct 12 Python
python切割图片的示例
Nov 12 Python
spark dataframe 将一列展开,把该列所有值都变成新列的方法
Jan 29 #Python
Python使用ctypes调用C/C++的方法
Jan 29 #Python
dataframe 按条件替换某一列中的值方法
Jan 29 #Python
Numpy之random函数使用学习
Jan 29 #Python
pandas DataFrame 删除重复的行的实现方法
Jan 29 #Python
使用Python向DataFrame中指定位置添加一列或多列的方法
Jan 29 #Python
Python Pexpect库的简单使用方法
Jan 29 #Python
You might like
PHP filter_var() 函数 Filter 函数
2012/04/25 PHP
php使用str_shuffle()函数生成随机字符串的方法分析
2017/02/17 PHP
php7 图形用户界面GUI 开发示例
2020/02/22 PHP
xmlHTTP实例
2006/10/24 Javascript
jquery中ajax学习笔记一
2011/10/16 Javascript
一个简单的js树形菜单
2011/12/09 Javascript
时间戳转换为时间 年月日时间的JS函数
2013/08/19 Javascript
JavaScript数组函数unshift、shift、pop、push使用实例
2014/08/27 Javascript
node.js中的fs.exists方法使用说明
2014/12/17 Javascript
使用js实现的简单拖拽效果
2015/03/18 Javascript
JavaScript+html5 canvas绘制的圆弧荡秋千效果完整实例
2016/01/26 Javascript
JavaScript直播评论发弹幕切图功能点集合效果代码
2016/06/26 Javascript
Javascript 事件冒泡机制详细介绍
2016/10/10 Javascript
移动端滑动插件Swipe教程
2016/10/16 Javascript
javascript中new Array()和var arr=[]用法区别
2017/12/01 Javascript
微信小程序实现笑脸评分功能
2018/11/03 Javascript
Node.js assert断言原理与用法分析
2019/01/04 Javascript
详解JSON.stringify()的5个秘密特性
2020/05/26 Javascript
Vue-cli4 配置 element-ui 按需引入操作
2020/09/11 Javascript
OpenLayers3实现地图显示功能
2020/09/25 Javascript
解决pycharm双击但是无法打开的情况
2020/10/31 Javascript
[03:36]2015国际邀请赛第二日现场精彩集锦
2015/08/06 DOTA
Python3 导入上级目录中的模块实例
2019/02/16 Python
matplotlib图例legend语法及设置的方法
2020/07/28 Python
Django返回HTML文件的实现方法
2020/09/17 Python
css3 background属性调整增强介绍
2010/12/18 HTML / CSS
CSS3实现苹果手机解锁的字体闪亮效果示例
2021/01/05 HTML / CSS
介绍一下内联、左联、右联
2013/12/31 面试题
超市5.1促销活动
2014/01/15 职场文书
机关节能减排实施方案
2014/03/17 职场文书
优秀德育工作者事迹材料
2014/05/07 职场文书
青春飞扬演讲稿
2014/09/11 职场文书
会计实训总结范文
2015/08/03 职场文书
教师研修随笔感言
2015/11/18 职场文书
php中配置文件保存修改操作 如config.php文件的读取修改等操作
2021/05/12 PHP
Javascript设计模式之原型模式详细
2021/10/05 Javascript