pandas获取groupby分组里最大值所在的行方法


Posted in Python onApril 20, 2018

pandas获取groupby分组里最大值所在的行方法

如下面这个DataFrame,按照Mt分组,取出Count最大的那行

import pandas as pd
df = pd.DataFrame({'Sp':['a','b','c','d','e','f'], 'Mt':['s1', 's1', 's2','s2','s2','s3'], 'Value':[1,2,3,4,5,6], 'Count':[3,2,5,10,10,6]})

df

Count Mt Sp Value
0 3 s1 a 1
1 2 s1 b 2
2 5 s2 c 3
3 10 s2 d 4
4 10 s2 e 5
5 6 s3 f 6

方法1:在分组中过滤出Count最大的行

df.groupby('Mt').apply(lambda t: t[t.Count==t.Count.max()])

Count Mt Sp Value
Mt
s1 0 3 s1 a 1
s2 3 10 s2 d 4
4 10 s2 e 5
s3 5 6 s3 f 6

方法2:用transform获取原dataframe的index,然后过滤出需要的行

print df.groupby(['Mt'])['Count'].agg(max)

idx=df.groupby(['Mt'])['Count'].transform(max)
print idx
idx1 = idx == df['Count']
print idx1

df[idx1]
Mt
s1 3
s2 10
s3 6
Name: Count, dtype: int64
0 3
1 3
2 10
3 10
4 10
5 6
dtype: int64
0 True
1 False
2 False
3 True
4 True
5 True
dtype: bool

Count Mt Sp Value
0 3 s1 a 1
3 10 s2 d 4
4 10 s2 e 5
5 6 s3 f 6

上面的方法都有个问题是3、4行的值都是最大值,这样返回了多行,如果只要返回一行呢?

方法3:idmax(旧版本pandas是argmax)

idx = df.groupby('Mt')['Count'].idxmax()
print idx
df.iloc[idx]
Mt
s1 0
s2 3
s3 5
Name: Count, dtype: int64

Count Mt Sp Value
0 3 s1 a 1
3 10 s2 d 4
5 6 s3 f 6
df.iloc[df.groupby(['Mt']).apply(lambda x: x['Count'].idxmax())]

Count Mt Sp Value
0 3 s1 a 1
3 10 s2 d 4
5 6 s3 f 6
def using_apply(df):
 return (df.groupby('Mt').apply(lambda subf: subf['Value'][subf['Count'].idxmax()]))

def using_idxmax_loc(df):
 idx = df.groupby('Mt')['Count'].idxmax()
 return df.loc[idx, ['Mt', 'Value']]

print using_apply(df)

using_idxmax_loc(df)
Mt
s1 1
s2 4
s3 6
dtype: int64

Mt Value
0 s1 1
3 s2 4
5 s3 6

方法4:先排好序,然后每组取第一个

df.sort('Count', ascending=False).groupby('Mt', as_index=False).first()

Mt Count Sp Value
0 s1 3 a 1
1 s2 10 d 4
2 s3 6 f 6

那问题又来了,如果不是要取出最大值所在的行,比如要中间值所在的那行呢?

思路还是类似,可能具体写法上要做一些修改,比如方法1和2要修改max算法,方法3要自己实现一个返回index的方法。 不管怎样,groupby之后,每个分组都是一个dataframe。

以上这篇pandas获取groupby分组里最大值所在的行方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
简单的Python2.7编程初学经验总结
Apr 01 Python
python简单图片操作:打开\显示\保存图像方法介绍
Nov 23 Python
详解Python中 sys.argv[]的用法简明解释
Dec 20 Python
Python实现爬取百度贴吧帖子所有楼层图片的爬虫示例
Apr 26 Python
详解Django的CSRF认证实现
Oct 09 Python
Python3最长回文子串算法示例
Mar 04 Python
用scikit-learn和pandas学习线性回归的方法
Jun 21 Python
Pytorch中index_select() 函数的实现理解
Nov 19 Python
Pytorch 之修改Tensor部分值方式
Dec 27 Python
Python3爬虫中Ajax的用法
Jul 10 Python
Python设计密码强度校验程序
Jul 30 Python
Python sqlalchemy时间戳及密码管理实现代码详解
Aug 01 Python
pandas多级分组实现排序的方法
Apr 20 #Python
Python PyQt4实现QQ抽屉效果
Apr 20 #Python
Python在groupby分组后提取指定位置记录方法
Apr 20 #Python
PyQt实现界面翻转切换效果
Apr 20 #Python
python3+PyQt5+Qt Designer实现堆叠窗口部件
Apr 20 #Python
python3 pandas 读取MySQL数据和插入的实例
Apr 20 #Python
PyQt5每天必学之事件与信号
Apr 20 #Python
You might like
轻松入门: 煮好咖啡的七个诀窍
2021/03/03 冲泡冲煮
用PHP程序实现支持页面后退的两种方法
2008/06/30 PHP
PHP 采集心得技巧
2009/05/15 PHP
php网站判断用户是否是手机访问的方法
2013/11/01 PHP
PHP缓存集成库phpFastCache用法
2014/12/15 PHP
解决在Laravel 中处理OPTIONS请求的问题
2019/10/11 PHP
JS禁用浏览器退格键实现思路及代码
2013/10/29 Javascript
在JavaScript中构建ArrayList示例代码
2014/09/17 Javascript
Javascript访问器属性实例分析
2014/12/30 Javascript
jQuery实现自定义下拉列表
2015/01/05 Javascript
Javascript无参数和有参数类继承问题解决方法
2015/03/02 Javascript
javascript获取重复次数最多的字符
2015/07/08 Javascript
Bootstrap 3 按钮标签实例代码
2017/02/21 Javascript
vue.js中过滤器的使用教程
2017/06/08 Javascript
前端图片懒加载(lazyload)的实现方法(提高用户体验)
2017/08/21 Javascript
通过nodejs 服务器读取HTML文件渲染到页面的方法
2018/05/17 NodeJs
用vue快速开发app的脚手架工具
2018/06/11 Javascript
Vue中的Props(不可变状态)
2018/09/29 Javascript
bootstrap中的导航条实例代码详解
2019/05/20 Javascript
vue-cli3项目升级到vue-cli4 的方法总结
2020/03/19 Javascript
vue设置全局访问接口API地址操作
2020/08/14 Javascript
js实现简易拖拽的示例
2020/10/26 Javascript
Python提取Linux内核源代码的目录结构实现方法
2016/06/24 Python
Django中Forms的使用代码解析
2018/02/10 Python
python之super的使用小结
2018/08/13 Python
给大家整理了19个pythonic的编程习惯(小结)
2019/09/25 Python
Django使用Profile扩展User模块方式
2020/05/14 Python
css3的focus-within选择器的使用
2020/05/11 HTML / CSS
德国宠物用品、宠物食品及水族馆网上商店:ZooRoyal
2017/07/09 全球购物
武汉某公司的C#笔试题面试题
2015/12/25 面试题
班班通校本培训方案
2014/03/12 职场文书
航海技术专业毕业生求职信
2014/04/06 职场文书
创建文明城市标语
2014/06/16 职场文书
幼儿园大班教师个人工作总结
2015/02/05 职场文书
干部理论学习心得体会
2016/01/21 职场文书
springmvc直接不经过controller访问WEB-INF中的页面问题
2022/02/24 Java/Android