对DataFrame数据中的重复行,利用groupby累加合并的方法详解


Posted in Python onJanuary 30, 2019

pandas读取一组数据,可能存在重复索引,虽然可以利用drop_duplicate直接删除,但是会删除重要信息。

比如同一ID用户,多次登录学习时间。要计算该用户总共‘'学习时间‘',就要把重复的ID的‘'学习时间‘'累加。

可以结合groupby和sum函数完成该操作。

实例如下:

新建一个DataFrame,计算每个 id 的总共学习时间。其中 id 为one/two的存在重复学习时间。先利用 groupby 按照键 id 分组,然后利用sum()函数求和,即可得到每个id的总共学习时间。

对DataFrame数据中的重复行,利用groupby累加合并的方法详解

以上这篇对DataFrame数据中的重复行,利用groupby累加合并的方法详解就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python写的一个简单DNS服务器实例
Jun 04 Python
用Python程序抓取网页的HTML信息的一个小实例
May 02 Python
Python实现删除文件但保留指定文件
Jun 21 Python
使用Python将数组的元素导出到变量中(unpacking)
Oct 27 Python
Python下载网络文本数据到本地内存的四种实现方法示例
Feb 05 Python
详解python3中tkinter知识点
Jun 21 Python
python环形单链表的约瑟夫问题详解
Sep 27 Python
Python图像处理之颜色的定义与使用分析
Jan 03 Python
pandas 时间格式转换的实现
Jul 06 Python
Django后台admin的使用详解
Jul 08 Python
Django1.11自带分页器paginator的使用方法
Oct 31 Python
python3.4中清屏的处理方法
Jul 06 Python
WIn10+Anaconda环境下安装PyTorch(避坑指南)
Jan 30 #Python
对dataframe数据之间求补集的实例详解
Jan 30 #Python
如何在Django中添加没有微秒的 DateTimeField 属性详解
Jan 30 #Python
Pandas统计重复的列里面的值方法
Jan 30 #Python
自学python的建议和周期预算
Jan 30 #Python
python DataFrame 取差集实例
Jan 30 #Python
对python dataframe逻辑取值的方法详解
Jan 30 #Python
You might like
PHP设计模式之责任链模式的深入解析
2013/06/13 PHP
百度工程师讲PHP函数的实现原理及性能分析(三)
2015/05/13 PHP
php面向对象基础详解【星际争霸游戏案例】
2020/01/23 PHP
JavaScript 解析Json字符串的性能比较分析代码
2009/12/16 Javascript
Javascript中的变量使用说明
2010/05/18 Javascript
jQuery学习基础知识小结
2010/11/25 Javascript
新浪微博字数统计 textarea字数统计实现代码
2011/08/28 Javascript
JQuery教学之性能优化
2014/05/14 Javascript
Javascript 函数parseInt()转换时出现bug问题
2014/05/20 Javascript
js实现的四级左侧网站分类菜单实例
2015/05/06 Javascript
javascript 用函数实现继承详解
2016/05/28 Javascript
AngularJS实现树形结构(ztree)菜单示例代码
2016/09/18 Javascript
谈谈JavaScript数组常用方法总结
2017/01/24 Javascript
基于JavaScript实现的折半查找算法示例
2017/04/14 Javascript
微信小程序仿美团城市选择
2018/06/06 Javascript
jQuery实现侧边栏隐藏与显示的方法详解
2018/12/22 jQuery
JavaScript的变量声明与声明提前用法实例分析
2019/11/26 Javascript
浅谈JavaScript中的“!!”作用
2020/08/03 Javascript
用Eclipse写python程序
2018/02/10 Python
python3安装pip3(install pip3 for python 3.x)
2018/04/03 Python
python 处理dataframe中的时间字段方法
2018/04/10 Python
python logging日志模块以及多进程日志详解
2018/04/18 Python
Python3使用TCP编写一个简易的文件下载器功能
2019/05/08 Python
django数据模型(Model)的字段类型解析
2019/12/25 Python
基于jupyter代码无法在pycharm中运行的解决方法
2020/04/21 Python
美国乡村商店:Plow & Hearth
2016/09/12 全球购物
BLACKMORES澳洲官网:澳大利亚排名第一的保健品牌
2018/09/27 全球购物
学前教育毕业生自荐信范文
2013/12/24 职场文书
综合实践活动方案
2014/02/14 职场文书
2014年车间工作总结
2014/11/21 职场文书
幸福终点站观后感
2015/06/04 职场文书
画展观后感
2015/06/17 职场文书
缅怀先烈主题班会
2015/08/14 职场文书
解决thinkphp6(tp6)在状态码500下不报错,或者显示错误“Malformed UTF-8 characters”的问题
2021/04/01 PHP
python内置进制转换函数的操作
2021/06/02 Python
windows server 2012安装FTP并配置被动模式指定开放端口
2022/06/10 Servers