编程 Python

pandas去重复行并分类汇总的实现方法

Posted in Python onJanuary 29, 2019

今天主要记录一下pandas去重复行以及如何分类汇总。以下面的数据帧作为一个例子：

import pandas as pd
data=pd.DataFrame({'产品':['A','A','A','A'],'数量':[50,50,30,30]})

pandas判断dataframe是否含有重复行数据用：df.duplicated()

第一次出现的数据为False.重复的数据行就被记录为True。

去掉重复行数据使用data.drop_duplicates().

pandas去重复行并分类汇总的实现方法

可以看到索引乱了,我们使用data.reset_index(),里面的参数drop=True，表明要舍掉原来的索引，不然的话原来的索引会保留下来。

pandas去重复行并分类汇总的实现方法

分类汇总主要使用groupby(表明汇总的条件列)以及agg(要汇总的字段/列以及汇总的方式：求和还是最大最小值或者计数)。完整代码如下图

# -*- coding: utf-8 -*-
"""
Created on Fri Jul 20 09:08:10 2018
@author: FanXiaoLei
"""
import pandas as pd
data=pd.DataFrame({'产品':['A','A','A','A'],'数量':[50,50,30,30]})
if data.duplicated:
  dataA=data.drop_duplicates().reset_index(drop=True)
print(dataA)
dataB=dataA.groupby(by='产品').agg({'数量':sum})
print('数据汇总结果:')
print(dataB)

结果展示如下图：

pandas去重复行并分类汇总的实现方法

以上就是本文的全部内容，希望对大家的学习有所帮助，也希望大家多多支持三水点靠木。

pandas去重复行并分类汇总的实现方法

- Author -

qq_24499417

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

python 实时遍历日志文件

Apr 12 Python

Python中常见的异常总结

Feb 20 Python

python 实现登录网页的操作方法

May 11 Python

Python pymongo模块常用操作分析

Sep 01 Python

Python中关键字global和nonlocal的区别详解

Sep 03 Python

Python中使用pypdf2合并、分割、加密pdf文件的代码详解

May 21 Python

在Python中过滤Windows文件名中的非法字符方法

Jun 10 Python

python中class的定义及使用教程

Sep 18 Python

python cv2读取rtsp实时码流按时生成连续视频文件方式

Dec 25 Python

django 文件上传功能的相关实例代码(简单易懂)

Jan 22 Python

Python如何使用队列方式实现多线程爬虫

May 12 Python

python小型的音频操作库mp3Play

Apr 24 Python

spark dataframe 将一列展开,把该列所有值都变成新列的方法

Jan 29 #Python

Python使用ctypes调用C/C++的方法

Jan 29 #Python

dataframe 按条件替换某一列中的值方法

Jan 29 #Python

Numpy之random函数使用学习

Jan 29 #Python

pandas DataFrame 删除重复的行的实现方法

Jan 29 #Python

使用Python向DataFrame中指定位置添加一列或多列的方法

Jan 29 #Python

Python Pexpect库的简单使用方法

Jan 29 #Python

You might like

新手学习PHP的一些基础知识分享

2011/07/27 PHP

深入php处理整数函数的详解

2013/06/09 PHP

如何使用php输出时间格式

2013/08/31 PHP

form表单传递数组数据、php脚本接收的实例

2017/02/09 PHP

php自定义函数br2nl实现将html中br换行符转换为文本输入中换行符的方法【与函数nl2br功能相反】

2017/02/17 PHP

YII2框架中behavior行为的理解与使用方法示例

2020/03/13 PHP

jQuery源码分析-01总体架构分析

2011/11/14 Javascript

jquery清空表单数据示例分享

2014/02/13 Javascript

jquery中checkbox全选失效的解决方法

2014/12/26 Javascript

jQuery自适应轮播图插件Swiper用法示例

2016/08/24 Javascript

手机端实现Bootstrap简单图片轮播效果

2016/10/13 Javascript

js实现做通讯录的索引滑动显示效果和滑动显示锚点效果

2017/02/18 Javascript

Vue+ElementUI实现表单动态渲染、可视化配置的方法

2018/03/07 Javascript

解决vue中使用swiper插件问题及swiper在vue中的用法

2018/04/04 Javascript

ES6中let 和 const 的新特性

2018/09/03 Javascript

在小程序/mpvue中使用flyio发起网络请求的方法

2018/09/13 Javascript

node app 打包工具pkg的具体使用

2019/01/17 Javascript

小程序云开发教程如何使用云函数实现点赞功能

2019/05/18 Javascript

VUE页面中通过双击实现复制表格中内容的示例代码

2020/06/11 Javascript

基于Web Audio API实现音频可视化效果

2020/06/12 Javascript

vue 二维码长按保存和复制内容操作

2020/09/22 Javascript

深入学习python的yield和generator

2016/03/10 Python

Django如何实现内容缓存示例详解

2017/09/24 Python

python Pexpect 实现输密码 scp 拷贝的方法

2019/01/03 Python

CSS3制作酷炫的条纹背景

2017/11/09 HTML / CSS

AmazeUI 模态窗口的实现代码

2020/08/18 HTML / CSS

城市观光通行证：The Sightseeing Pass

2018/04/28 全球购物

波兰补充商店：Muscle Power

2018/10/29 全球购物

匡威意大利官方商店：Converse意大利

2018/11/27 全球购物

车辆安全检查制度

2014/01/12 职场文书

教师师德演讲稿

2014/05/06 职场文书

大学生党员个人剖析材料

2014/10/08 职场文书

九寨沟导游词

2015/02/02 职场文书

辞职信格式模板

2015/02/27 职场文书

小学总务工作总结

2015/08/13 职场文书

教你怎么用Python操作MySql数据库

2021/05/31 Python