pandas去重复行并分类汇总的实现方法


Posted in Python onJanuary 29, 2019

今天主要记录一下pandas去重复行以及如何分类汇总。以下面的数据帧作为一个例子: 

import pandas as pd
data=pd.DataFrame({'产品':['A','A','A','A'],'数量':[50,50,30,30]})

pandas判断dataframe是否含有重复行数据用:df.duplicated()

pandas去重复行并分类汇总的实现方法

 第一次出现的数据为False.重复的数据行就被记录为True。

去掉重复行数据使用data.drop_duplicates().

pandas去重复行并分类汇总的实现方法

 可以看到索引乱了,我们使用data.reset_index(),里面的参数drop=True,表明要舍掉原来的索引,不然的话原来的索引会保留下来。

pandas去重复行并分类汇总的实现方法

 分类汇总主要使用groupby(表明汇总的条件列)以及agg(要汇总的字段/列以及汇总的方式:求和还是最大最小值或者计数)。完整代码如下图

# -*- coding: utf-8 -*-
"""
Created on Fri Jul 20 09:08:10 2018
@author: FanXiaoLei
"""
import pandas as pd
data=pd.DataFrame({'产品':['A','A','A','A'],'数量':[50,50,30,30]})
if data.duplicated:
  dataA=data.drop_duplicates().reset_index(drop=True)
print(dataA)
dataB=dataA.groupby(by='产品').agg({'数量':sum})
print('数据汇总结果:')
print(dataB)

结果展示如下图:

pandas去重复行并分类汇总的实现方法

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python列表推导式的使用方法
Nov 21 Python
python将文本转换成图片输出的方法
Apr 28 Python
django启动uwsgi报错的解决方法
Apr 08 Python
python3中获取文件当前绝对路径的两种方法
Apr 26 Python
详解django2中关于时间处理策略
Mar 06 Python
完美解决python3.7 pip升级 拒绝访问问题
Jul 12 Python
Flask框架请求钩子与request请求对象用法实例分析
Nov 07 Python
Python代码生成视频的缩略图的实例讲解
Dec 22 Python
新手入门学习python Numpy基础操作
Mar 02 Python
Python多线程thread及模块使用实例
Apr 28 Python
Python3合并两个有序数组代码实例
Aug 11 Python
scrapy中如何设置应用cookies的方法(3种)
Sep 22 Python
spark dataframe 将一列展开,把该列所有值都变成新列的方法
Jan 29 #Python
Python使用ctypes调用C/C++的方法
Jan 29 #Python
dataframe 按条件替换某一列中的值方法
Jan 29 #Python
Numpy之random函数使用学习
Jan 29 #Python
pandas DataFrame 删除重复的行的实现方法
Jan 29 #Python
使用Python向DataFrame中指定位置添加一列或多列的方法
Jan 29 #Python
Python Pexpect库的简单使用方法
Jan 29 #Python
You might like
PHP 正则表达式之正则处理函数小结(preg_match,preg_match_all,preg_replace,preg_split)
2012/10/05 PHP
php学习笔记之面向对象编程
2012/12/29 PHP
php根据年月获取季度的方法
2014/03/31 PHP
php数组生成html下拉列表的方法
2015/07/20 PHP
php ajax异步读取rss文档数据
2016/03/29 PHP
Google AJAX 搜索 API实现代码
2010/11/17 Javascript
js特效,页面下雪的小例子
2013/06/17 Javascript
用JS在浏览器中创建下载文件
2014/03/05 Javascript
在JavaScript应用中实现延迟加载的方法
2015/06/25 Javascript
Javascript使用post方法提交数据实例
2015/08/03 Javascript
js基于setTimeout与setInterval实现多线程
2016/06/17 Javascript
使用jQuery加载html页面到指定的div实现方法
2016/07/13 Javascript
easyui datebox 时间限制,datebox开始时间限制结束时间,datebox截止日期比起始日期大的实现代码
2017/01/12 Javascript
bootstrap table表格使用方法详解
2017/04/26 Javascript
ES6学习教程之模板字符串详解
2017/10/09 Javascript
Vue不能检测到Object/Array更新的情况的解决
2018/06/26 Javascript
layer弹出层全屏及关闭方法
2018/08/17 Javascript
详解如何使用微信小程序云函数发送短信验证码
2019/03/13 Javascript
javascript解析json格式的数据方法详解
2020/08/07 Javascript
Python基于twisted实现简单的web服务器
2014/09/29 Python
python 专题九 Mysql数据库编程基础知识
2017/03/16 Python
Python中的异常处理try/except/finally/raise用法分析
2019/02/28 Python
PYcharm 激活方法(推荐)
2020/03/23 Python
使用CSS3实现字体颜色渐变的实现
2020/08/10 HTML / CSS
自我评价范文点评
2013/12/04 职场文书
大学生专科学习生活的自我评价
2013/12/07 职场文书
菜篮子工程实施方案
2014/03/08 职场文书
条幅标语大全
2014/06/20 职场文书
汉语言文学毕业求职信
2014/07/17 职场文书
摩登时代观后感
2015/06/03 职场文书
婚宴父亲致辞
2015/07/27 职场文书
初中体育教学随笔
2015/08/15 职场文书
2016年习总书记讲话学习心得体会
2016/01/20 职场文书
导游词之泉州崇武古城
2019/12/20 职场文书
python游戏开发之pygame实现接球小游戏
2022/04/22 Python
Python sklearn分类决策树方法详解
2022/09/23 Python