pandas去重复行并分类汇总的实现方法


Posted in Python onJanuary 29, 2019

今天主要记录一下pandas去重复行以及如何分类汇总。以下面的数据帧作为一个例子: 

import pandas as pd
data=pd.DataFrame({'产品':['A','A','A','A'],'数量':[50,50,30,30]})

pandas判断dataframe是否含有重复行数据用:df.duplicated()

pandas去重复行并分类汇总的实现方法

 第一次出现的数据为False.重复的数据行就被记录为True。

去掉重复行数据使用data.drop_duplicates().

pandas去重复行并分类汇总的实现方法

 可以看到索引乱了,我们使用data.reset_index(),里面的参数drop=True,表明要舍掉原来的索引,不然的话原来的索引会保留下来。

pandas去重复行并分类汇总的实现方法

 分类汇总主要使用groupby(表明汇总的条件列)以及agg(要汇总的字段/列以及汇总的方式:求和还是最大最小值或者计数)。完整代码如下图

# -*- coding: utf-8 -*-
"""
Created on Fri Jul 20 09:08:10 2018
@author: FanXiaoLei
"""
import pandas as pd
data=pd.DataFrame({'产品':['A','A','A','A'],'数量':[50,50,30,30]})
if data.duplicated:
  dataA=data.drop_duplicates().reset_index(drop=True)
print(dataA)
dataB=dataA.groupby(by='产品').agg({'数量':sum})
print('数据汇总结果:')
print(dataB)

结果展示如下图:

pandas去重复行并分类汇总的实现方法

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
十个Python程序员易犯的错误
Dec 15 Python
Python简单删除列表中相同元素的方法示例
Jun 12 Python
python difflib模块示例讲解
Sep 13 Python
使用python爬虫实现网络股票信息爬取的demo
Jan 05 Python
解决python通过cx_Oracle模块连接Oracle乱码的问题
Oct 18 Python
使用django-guardian实现django-admin的行级权限控制的方法
Oct 30 Python
python numpy 按行归一化的实例
Jan 21 Python
Python二维码生成识别实例详解
Jul 16 Python
pytorch中torch.max和Tensor.view函数用法详解
Jan 03 Python
Pytorch之finetune使用详解
Jan 18 Python
django创建css文件夹的具体方法
Jul 31 Python
Python制作春联的示例代码
Jan 22 Python
spark dataframe 将一列展开,把该列所有值都变成新列的方法
Jan 29 #Python
Python使用ctypes调用C/C++的方法
Jan 29 #Python
dataframe 按条件替换某一列中的值方法
Jan 29 #Python
Numpy之random函数使用学习
Jan 29 #Python
pandas DataFrame 删除重复的行的实现方法
Jan 29 #Python
使用Python向DataFrame中指定位置添加一列或多列的方法
Jan 29 #Python
Python Pexpect库的简单使用方法
Jan 29 #Python
You might like
php实现自动获取生成文章主题关键词功能的深入分析
2013/06/03 PHP
table标签的结构与合并单元格的实现方法
2013/07/24 PHP
PHP获取php,mysql,apche的版本信息示例代码
2014/01/16 PHP
ThinkPHP控制器里javascript代码不能执行的解决方法
2014/11/22 PHP
php+jQuery.uploadify实现文件上传教程
2014/12/26 PHP
php+mysql实现用户注册登陆的方法
2015/01/03 PHP
PHP检查网站是否宕机的方法示例
2017/07/24 PHP
两个JavaScript jsFiddle JSBin在线调试器
2010/03/14 Javascript
Javascript之旅 对象的原型链之由来
2010/08/25 Javascript
浅谈Javascript嵌套函数及闭包
2010/11/09 Javascript
jquery提交form表单简单示例分享
2014/03/03 Javascript
javascript的switch用法注意事项分析
2015/02/02 Javascript
浅谈javascript事件取消和阻止冒泡
2015/05/26 Javascript
jQuery实现响应鼠标滚动的动感菜单效果
2015/09/21 Javascript
bootstrap按钮插件(Button)使用方法解析
2017/01/13 Javascript
Javascript同时声明一连串(多个)变量的方法
2017/01/23 Javascript
vue.js单页面应用实例的简单实现
2017/04/10 Javascript
vue-cli中的webpack配置详解
2017/09/25 Javascript
PHPStorm中如何对nodejs项目进行单元测试详解
2019/02/28 NodeJs
vue动画效果实现方法示例
2019/03/18 Javascript
如何在JavaScript中创建具有多个空格的字符串?
2020/02/23 Javascript
python定时采集摄像头图像上传ftp服务器功能实现
2013/12/23 Python
Python中使用摄像头实现简单的延时摄影技术
2015/03/27 Python
Python获取运行目录与当前脚本目录的方法
2015/06/01 Python
Python实现根据IP地址和子网掩码算出网段的方法
2015/07/30 Python
Python代码解决RenderView窗口not found问题
2016/08/28 Python
Python2.7环境Flask框架安装简明教程【已测试】
2018/07/13 Python
Tesserocr库的正确安装方式
2018/10/19 Python
python循环定时中断执行某一段程序的实例
2019/06/29 Python
Django之PopUp的具体实现方法
2019/08/31 Python
实例讲解CSS3中的box-flex弹性盒属性布局
2016/06/09 HTML / CSS
HTML5中div、article、section的区别及使用介绍
2013/08/14 HTML / CSS
服务生自我鉴定
2014/01/22 职场文书
年度考核自我评价
2014/01/25 职场文书
2015元旦晚会主持人开场白+结束语
2014/12/14 职场文书
家长会欢迎词
2015/01/23 职场文书