pandas去重复行并分类汇总的实现方法


Posted in Python onJanuary 29, 2019

今天主要记录一下pandas去重复行以及如何分类汇总。以下面的数据帧作为一个例子: 

import pandas as pd
data=pd.DataFrame({'产品':['A','A','A','A'],'数量':[50,50,30,30]})

pandas判断dataframe是否含有重复行数据用:df.duplicated()

pandas去重复行并分类汇总的实现方法

 第一次出现的数据为False.重复的数据行就被记录为True。

去掉重复行数据使用data.drop_duplicates().

pandas去重复行并分类汇总的实现方法

 可以看到索引乱了,我们使用data.reset_index(),里面的参数drop=True,表明要舍掉原来的索引,不然的话原来的索引会保留下来。

pandas去重复行并分类汇总的实现方法

 分类汇总主要使用groupby(表明汇总的条件列)以及agg(要汇总的字段/列以及汇总的方式:求和还是最大最小值或者计数)。完整代码如下图

# -*- coding: utf-8 -*-
"""
Created on Fri Jul 20 09:08:10 2018
@author: FanXiaoLei
"""
import pandas as pd
data=pd.DataFrame({'产品':['A','A','A','A'],'数量':[50,50,30,30]})
if data.duplicated:
  dataA=data.drop_duplicates().reset_index(drop=True)
print(dataA)
dataB=dataA.groupby(by='产品').agg({'数量':sum})
print('数据汇总结果:')
print(dataB)

结果展示如下图:

pandas去重复行并分类汇总的实现方法

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python 实时遍历日志文件
Apr 12 Python
Python中常见的异常总结
Feb 20 Python
python 实现登录网页的操作方法
May 11 Python
Python pymongo模块常用操作分析
Sep 01 Python
Python中关键字global和nonlocal的区别详解
Sep 03 Python
Python中使用pypdf2合并、分割、加密pdf文件的代码详解
May 21 Python
在Python中过滤Windows文件名中的非法字符方法
Jun 10 Python
python中class的定义及使用教程
Sep 18 Python
python cv2读取rtsp实时码流按时生成连续视频文件方式
Dec 25 Python
django 文件上传功能的相关实例代码(简单易懂)
Jan 22 Python
Python如何使用队列方式实现多线程爬虫
May 12 Python
python小型的音频操作库mp3Play
Apr 24 Python
spark dataframe 将一列展开,把该列所有值都变成新列的方法
Jan 29 #Python
Python使用ctypes调用C/C++的方法
Jan 29 #Python
dataframe 按条件替换某一列中的值方法
Jan 29 #Python
Numpy之random函数使用学习
Jan 29 #Python
pandas DataFrame 删除重复的行的实现方法
Jan 29 #Python
使用Python向DataFrame中指定位置添加一列或多列的方法
Jan 29 #Python
Python Pexpect库的简单使用方法
Jan 29 #Python
You might like
新手学习PHP的一些基础知识分享
2011/07/27 PHP
深入php处理整数函数的详解
2013/06/09 PHP
如何使用php输出时间格式
2013/08/31 PHP
form表单传递数组数据、php脚本接收的实例
2017/02/09 PHP
php自定义函数br2nl实现将html中br换行符转换为文本输入中换行符的方法【与函数nl2br功能相反】
2017/02/17 PHP
YII2框架中behavior行为的理解与使用方法示例
2020/03/13 PHP
jQuery源码分析-01总体架构分析
2011/11/14 Javascript
jquery清空表单数据示例分享
2014/02/13 Javascript
jquery中checkbox全选失效的解决方法
2014/12/26 Javascript
jQuery自适应轮播图插件Swiper用法示例
2016/08/24 Javascript
手机端实现Bootstrap简单图片轮播效果
2016/10/13 Javascript
js实现做通讯录的索引滑动显示效果和滑动显示锚点效果
2017/02/18 Javascript
Vue+ElementUI实现表单动态渲染、可视化配置的方法
2018/03/07 Javascript
解决vue中使用swiper插件问题及swiper在vue中的用法
2018/04/04 Javascript
ES6中let 和 const 的新特性
2018/09/03 Javascript
在小程序/mpvue中使用flyio发起网络请求的方法
2018/09/13 Javascript
node app 打包工具pkg的具体使用
2019/01/17 Javascript
小程序云开发教程如何使用云函数实现点赞功能
2019/05/18 Javascript
VUE页面中通过双击实现复制表格中内容的示例代码
2020/06/11 Javascript
基于Web Audio API实现音频可视化效果
2020/06/12 Javascript
vue 二维码长按保存和复制内容操作
2020/09/22 Javascript
深入学习python的yield和generator
2016/03/10 Python
Django如何实现内容缓存示例详解
2017/09/24 Python
python Pexpect 实现输密码 scp 拷贝的方法
2019/01/03 Python
CSS3制作酷炫的条纹背景
2017/11/09 HTML / CSS
AmazeUI 模态窗口的实现代码
2020/08/18 HTML / CSS
城市观光通行证:The Sightseeing Pass
2018/04/28 全球购物
波兰补充商店:Muscle Power
2018/10/29 全球购物
匡威意大利官方商店 :Converse意大利
2018/11/27 全球购物
车辆安全检查制度
2014/01/12 职场文书
教师师德演讲稿
2014/05/06 职场文书
大学生党员个人剖析材料
2014/10/08 职场文书
九寨沟导游词
2015/02/02 职场文书
辞职信格式模板
2015/02/27 职场文书
小学总务工作总结
2015/08/13 职场文书
教你怎么用Python操作MySql数据库
2021/05/31 Python