对DataFrame数据中的重复行,利用groupby累加合并的方法详解


Posted in Python onJanuary 30, 2019

pandas读取一组数据,可能存在重复索引,虽然可以利用drop_duplicate直接删除,但是会删除重要信息。

比如同一ID用户,多次登录学习时间。要计算该用户总共‘'学习时间‘',就要把重复的ID的‘'学习时间‘'累加。

可以结合groupby和sum函数完成该操作。

实例如下:

新建一个DataFrame,计算每个 id 的总共学习时间。其中 id 为one/two的存在重复学习时间。先利用 groupby 按照键 id 分组,然后利用sum()函数求和,即可得到每个id的总共学习时间。

对DataFrame数据中的重复行,利用groupby累加合并的方法详解

以上这篇对DataFrame数据中的重复行,利用groupby累加合并的方法详解就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
数据挖掘之Apriori算法详解和Python实现代码分享
Nov 07 Python
Python中__name__的使用实例
Apr 14 Python
Python随手笔记之标准类型内建函数
Dec 02 Python
python生成随机图形验证码详解
Nov 08 Python
python线程池threadpool实现篇
Apr 27 Python
python绘图模块matplotlib示例详解
Jul 26 Python
Anaconda+VSCode配置tensorflow开发环境的教程详解
Mar 30 Python
python argparse传入布尔参数false不生效的解决
Apr 20 Python
pycharm 2018 激活码及破解补丁激活方式
Sep 21 Python
Django正则URL匹配实现流程解析
Nov 13 Python
python中remove函数的踩坑记录
Jan 04 Python
基于Python实现一个春节倒计时脚本
Jan 22 Python
WIn10+Anaconda环境下安装PyTorch(避坑指南)
Jan 30 #Python
对dataframe数据之间求补集的实例详解
Jan 30 #Python
如何在Django中添加没有微秒的 DateTimeField 属性详解
Jan 30 #Python
Pandas统计重复的列里面的值方法
Jan 30 #Python
自学python的建议和周期预算
Jan 30 #Python
python DataFrame 取差集实例
Jan 30 #Python
对python dataframe逻辑取值的方法详解
Jan 30 #Python
You might like
1 Tube Radio
2021/03/02 无线电
php 正则 过滤html 的超链接
2009/06/02 PHP
简单的移动设备检测PHP脚本代码
2011/02/19 PHP
php笔记之:初探PHPcms模块开发介绍
2013/04/26 PHP
php中使用$_REQUEST需要注意的一个问题
2013/05/02 PHP
php生成shtml类用法实例
2014/12/09 PHP
PHP实现Session入库/存入redis的方法
2017/05/04 PHP
PHP-FPM的配置与优化讲解
2019/03/15 PHP
javascript对话框使用方法(警告框 javascript确认框 提示框)
2014/01/07 Javascript
JS二维数组的定义说明
2014/03/03 Javascript
js实现登陆遮罩效果的方法
2015/07/28 Javascript
jQuery将表单序列化成一个Object对象的实例
2016/11/29 Javascript
js前端日历控件(悬浮、拖拽、自由变形)
2017/03/02 Javascript
详解RequireJS按需加载样式文件
2017/04/12 Javascript
vue element upload组件 file-list的动态绑定实现
2019/10/11 Javascript
node实现mock-plugin中间件的方法
2019/12/25 Javascript
重命名批处理python脚本
2013/04/05 Python
Python入门篇之文件
2014/10/20 Python
python和shell监控linux服务器的详细代码
2018/06/22 Python
Python设计模式之工厂方法模式实例详解
2019/01/18 Python
pandas.cut具体使用总结
2019/06/24 Python
python二进制文件的转译详解
2019/07/03 Python
Python 进程之间共享数据(全局变量)的方法
2019/07/16 Python
tensorflow 获取checkpoint中的变量列表实例
2020/02/11 Python
python烟花效果的代码实例
2020/02/25 Python
解决pycharm debug时界面下方不出现step等按钮及变量值的问题
2020/06/09 Python
美国嘻哈文化生活方式品牌:GLD
2018/04/15 全球购物
2014年3.15团委活动总结
2014/03/16 职场文书
幼儿园春季开学寄语
2014/04/03 职场文书
个人股份转让协议书范本
2015/01/28 职场文书
2015上半年个人工作总结
2015/07/27 职场文书
《包身工》教学反思
2016/02/23 职场文书
详解MySQL数据库千万级数据查询和存储
2021/05/18 MySQL
python使用pymysql模块操作MySQL
2021/06/16 Python
python中Matplotlib绘制直线的实例代码
2021/07/04 Python