pandas去重复行并分类汇总的实现方法


Posted in Python onJanuary 29, 2019

今天主要记录一下pandas去重复行以及如何分类汇总。以下面的数据帧作为一个例子: 

import pandas as pd
data=pd.DataFrame({'产品':['A','A','A','A'],'数量':[50,50,30,30]})

pandas判断dataframe是否含有重复行数据用:df.duplicated()

pandas去重复行并分类汇总的实现方法

 第一次出现的数据为False.重复的数据行就被记录为True。

去掉重复行数据使用data.drop_duplicates().

pandas去重复行并分类汇总的实现方法

 可以看到索引乱了,我们使用data.reset_index(),里面的参数drop=True,表明要舍掉原来的索引,不然的话原来的索引会保留下来。

pandas去重复行并分类汇总的实现方法

 分类汇总主要使用groupby(表明汇总的条件列)以及agg(要汇总的字段/列以及汇总的方式:求和还是最大最小值或者计数)。完整代码如下图

# -*- coding: utf-8 -*-
"""
Created on Fri Jul 20 09:08:10 2018
@author: FanXiaoLei
"""
import pandas as pd
data=pd.DataFrame({'产品':['A','A','A','A'],'数量':[50,50,30,30]})
if data.duplicated:
  dataA=data.drop_duplicates().reset_index(drop=True)
print(dataA)
dataB=dataA.groupby(by='产品').agg({'数量':sum})
print('数据汇总结果:')
print(dataB)

结果展示如下图:

pandas去重复行并分类汇总的实现方法

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
win7 下搭建sublime的python开发环境的配置方法
Jun 18 Python
详解Python的迭代器、生成器以及相关的itertools包
Apr 02 Python
python根据日期返回星期几的方法
Jul 06 Python
Django框架中的对象列表视图使用示例
Jul 21 Python
用Python的Django框架来制作一个RSS阅读器
Jul 22 Python
python逆向入门教程
Jan 15 Python
Python使用SQLite和Excel操作进行数据分析
Jan 20 Python
[原创]Python入门教程5. 字典基本操作【定义、运算、常用函数】
Nov 01 Python
使用Python操作FTP实现上传和下载的方法
Apr 01 Python
Python模拟登录和登录跳转的参考示例
Oct 30 Python
详解python字符串驻留技术
May 21 Python
Python中的pprint模块
Nov 27 Python
spark dataframe 将一列展开,把该列所有值都变成新列的方法
Jan 29 #Python
Python使用ctypes调用C/C++的方法
Jan 29 #Python
dataframe 按条件替换某一列中的值方法
Jan 29 #Python
Numpy之random函数使用学习
Jan 29 #Python
pandas DataFrame 删除重复的行的实现方法
Jan 29 #Python
使用Python向DataFrame中指定位置添加一列或多列的方法
Jan 29 #Python
Python Pexpect库的简单使用方法
Jan 29 #Python
You might like
实用函数10
2007/11/08 PHP
php中url传递中文字符,特殊危险字符的解决方法
2013/08/17 PHP
理解PHP中的Session及对Session有效期的控制
2016/01/08 PHP
php文档工具PHP Documentor安装与使用方法
2016/01/25 PHP
使用symfony命令创建项目的方法
2016/03/17 PHP
php array_walk 对数组中的每个元素应用用户自定义函数详解
2016/11/18 PHP
php 多继承的几种常见实现方法示例
2019/11/18 PHP
jQuery EasyUI NumberBox(数字框)的用法
2010/07/08 Javascript
JS date对象的减法处理实现代码
2010/12/28 Javascript
JavaScript之自定义类型
2012/05/04 Javascript
js 鼠标移动显示图片的简单实例
2013/12/25 Javascript
基于bootstrap3和jquery的分页插件
2015/07/31 Javascript
jQuery插件实现静态HTML验证码校验
2015/11/06 Javascript
使用开源工具制作网页验证码的方法
2016/10/17 Javascript
js Canvas绘制圆形时钟教程
2017/02/06 Javascript
js实现九宫格的随机颜色跳转
2017/02/19 Javascript
详解vue中引入stylus及报错解决方法
2017/09/22 Javascript
vue router的基本使用和配置教程
2018/11/05 Javascript
浅谈Vue为什么不能检测数组变动
2019/10/14 Javascript
在vue-cli创建的项目中使用sass操作
2020/08/10 Javascript
解决python中用matplotlib画多幅图时出现图形部分重叠的问题
2019/07/07 Python
Django REST框架创建一个简单的Api实例讲解
2019/11/05 Python
Python读取YAML文件过程详解
2019/12/30 Python
python 爬取马蜂窝景点翻页文字评论的实现
2020/01/20 Python
使用TensorFlow搭建一个全连接神经网络教程
2020/02/06 Python
详解pandas.DataFrame.plot() 画图函数
2020/06/14 Python
纯CSS3实现鼠标悬停提示气泡效果
2014/02/28 HTML / CSS
HTML5之语义标签介绍
2016/07/07 HTML / CSS
I.T集团香港官方商城:ITeSHOP.com Hong Kong
2019/02/15 全球购物
C#软件工程师英语面试题
2015/06/07 面试题
球队口号
2014/06/18 职场文书
材料专业大学毕业生自荐书
2014/07/02 职场文书
党员学习中共十八大思想报告
2014/09/12 职场文书
裁员通知
2015/04/25 职场文书
寒假生活随笔
2015/08/15 职场文书
2016开学第一课心得体会
2016/01/23 职场文书