pandas去重复行并分类汇总的实现方法


Posted in Python onJanuary 29, 2019

今天主要记录一下pandas去重复行以及如何分类汇总。以下面的数据帧作为一个例子: 

import pandas as pd
data=pd.DataFrame({'产品':['A','A','A','A'],'数量':[50,50,30,30]})

pandas判断dataframe是否含有重复行数据用:df.duplicated()

pandas去重复行并分类汇总的实现方法

 第一次出现的数据为False.重复的数据行就被记录为True。

去掉重复行数据使用data.drop_duplicates().

pandas去重复行并分类汇总的实现方法

 可以看到索引乱了,我们使用data.reset_index(),里面的参数drop=True,表明要舍掉原来的索引,不然的话原来的索引会保留下来。

pandas去重复行并分类汇总的实现方法

 分类汇总主要使用groupby(表明汇总的条件列)以及agg(要汇总的字段/列以及汇总的方式:求和还是最大最小值或者计数)。完整代码如下图

# -*- coding: utf-8 -*-
"""
Created on Fri Jul 20 09:08:10 2018
@author: FanXiaoLei
"""
import pandas as pd
data=pd.DataFrame({'产品':['A','A','A','A'],'数量':[50,50,30,30]})
if data.duplicated:
  dataA=data.drop_duplicates().reset_index(drop=True)
print(dataA)
dataB=dataA.groupby(by='产品').agg({'数量':sum})
print('数据汇总结果:')
print(dataB)

结果展示如下图:

pandas去重复行并分类汇总的实现方法

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python字典快速保存于读取的方法
Mar 23 Python
Python 实现一行输入多个值的方法
Apr 21 Python
Django + Uwsgi + Nginx 实现生产环境部署的方法
Jun 20 Python
python中的json总结
Oct 11 Python
解决python3 HTMLTestRunner测试报告中文乱码的问题
Dec 17 Python
Python把对应格式的csv文件转换成字典类型存储脚本的方法
Feb 12 Python
浅谈Django+Gunicorn+Nginx部署之路
Sep 11 Python
Django调用百度AI接口实现人脸注册登录代码实例
Apr 23 Python
python百行代码自制电脑端网速悬浮窗的实现
May 12 Python
在django中实现choices字段获取对应字段值
Jul 12 Python
python实现移动木板小游戏
Oct 09 Python
浅谈tf.train.Saver()与tf.train.import_meta_graph的要点
May 26 Python
spark dataframe 将一列展开,把该列所有值都变成新列的方法
Jan 29 #Python
Python使用ctypes调用C/C++的方法
Jan 29 #Python
dataframe 按条件替换某一列中的值方法
Jan 29 #Python
Numpy之random函数使用学习
Jan 29 #Python
pandas DataFrame 删除重复的行的实现方法
Jan 29 #Python
使用Python向DataFrame中指定位置添加一列或多列的方法
Jan 29 #Python
Python Pexpect库的简单使用方法
Jan 29 #Python
You might like
浅析php中json_encode()和json_decode()
2014/05/25 PHP
PHP异常处理定义与使用方法分析
2017/07/25 PHP
PHP读取、解析eml文件及生成网页的方法示例
2017/09/04 PHP
js模拟实现Array的sort方法
2007/12/11 Javascript
Javascript加载速度慢的解决方案
2014/03/11 Javascript
jQuery插件Validate实现自定义表单验证
2016/01/18 Javascript
JavaScript入门教程之引用类型
2016/05/04 Javascript
Angular2从搭建环境到开发步骤详解
2016/10/17 Javascript
easyUI实现类似搜索框关键词自动提示功能示例代码
2016/12/27 Javascript
vue中element组件样式修改无效的解决方法
2018/02/03 Javascript
jQuery使用动画队列自定义动画操作示例
2018/06/16 jQuery
详解Angular6.0使用路由步骤(共7步)
2018/06/29 Javascript
解决angular2在双向数据绑定时[(ngModel)]无法使用的问题
2018/09/13 Javascript
Vue动态组件与异步组件实例详解
2019/02/23 Javascript
小程序数据通信方法大全(推荐)
2019/04/15 Javascript
javascript中的数据类型检测方法详解
2019/08/07 Javascript
jQuery+ajax实现用户登录验证
2020/09/13 jQuery
[02:17]TI4西雅图DOTA2前线报道 啸天mik夫妻档解说
2014/07/08 DOTA
Python使用稀疏矩阵节省内存实例
2014/06/27 Python
安装python3的时候就是输入python3死活没有反应的解决方法
2018/01/24 Python
python实现超简单的视频对象提取功能
2018/06/04 Python
Python读取excel中的图片完美解决方法
2018/07/27 Python
Selenium控制浏览器常见操作示例
2018/08/13 Python
django利用request id便于定位及给日志加上request_id
2018/08/26 Python
python GUI库图形界面开发之PyQt5布局控件QGridLayout详细使用方法与实例
2020/03/06 Python
Python 3.8 新功能来一波(大部分人都不知道)
2020/03/11 Python
解决安装新版PyQt5、PyQT5-tool后打不开并Designer.exe提示no Qt platform plugin的问题
2020/04/24 Python
澳洲网红粉泥面膜:Sand & Sky
2019/08/13 全球购物
曼城官方网上商店:Manchester City
2019/09/10 全球购物
澳大利亚在线高跟鞋商店:Shoe Me
2019/11/19 全球购物
服装公司总经理岗位职责
2013/11/30 职场文书
学生会干部自荐信
2014/02/04 职场文书
医疗器械售后服务承诺书
2014/05/21 职场文书
新文化运动的基本口号
2014/06/21 职场文书
公司介绍信范文
2015/01/31 职场文书
工作服管理制度范本
2015/08/06 职场文书