在pandas多重索引multiIndex中选定指定索引的行方法


Posted in Python onNovember 16, 2018

在multiIndex中选定指定索引的行

我们在用pandas类似groupby来使用多重index时,有时想要对多个level中的某个index对应的行进行操作,就需要在dataframe中找到该index对应的行,在单层index中我们可以方便的使用df.loc[index]来选择,在多重Index中我们可以利用的类似的思路,然而其中也有一些小坑,记录如下。

1 index为有序的

1.1 创建测试数据

首先创建一个dataframe数据

df = pd.DataFrame({'class':['A','A','A','B','B','B','C','C'],
   'id':['a','b','c','a','b','c','a','b'],
   'value':[1,2,3,4,5,6,7,8]})

df中内容如下图:

在pandas多重索引multiIndex中选定指定索引的行方法

1.2 设置multiIndex

通过set_index设为多重索引

df = df.set_index(['class','id'])

设置索引后效果:

在pandas多重索引multiIndex中选定指定索引的行方法

1.3 切片筛选index

这里同样使用loc定位

df.loc[('A',slice(None)),:]

各参数的解释如下:

loc[(a,b),c]中第一个参数元组为索引内容,a为level0索引对应的内容,b为level1索引对应的内容

因为df是一个dataframe,所以要用c来指定列

这里‘A',指选择class中的A类

slice(None), 是Python中的切片操作,这里用来选择任意的id,要注意!不能使用‘:'来指定任意index

‘:',用来指定dataframe任意的列

执行后的结果如下:

在pandas多重索引multiIndex中选定指定索引的行方法

同样,如果想只保留id中的'a',则可以使用:

df.loc[(slice(None),'a'),:]

2 index无序

前面的例子对应的index列为数字或字母,是有序的,接下来我们看看index列为中文的情况。

2.1 创建无序测试数据

df2 = pd.DataFrame({'课程':['语文','语文','数学','数学'],'得分':['最高','最低','最高','最低'],'分值':[90,50,100,60]})
df2 = df2.set_index(['课程','得分'])

在pandas多重索引multiIndex中选定指定索引的行方法

2.2 尝试切片选择index

df2.loc[('语文',slice(None)),:]

我们进行同样的操作,这时会发现提示出错:

UnsortedIndexError: 'MultiIndex Slicing requires the index to be fully lexsorted tuple len (2), lexsort depth (0)'

这是因为此时的index无法进行排序,在pandas文档中提到:Furthermore if you try to index something that is not fully lexsorted, this can raise:

我们可以通过 df2.index.is_lexsorted()来检查index是否有序,

In[1]: df2.index.is_lexsorted()
out[1]: False

接下来,我们尝试对Index进行排序。(排序时要在level里指定index名)

2.3 对index排序后切片选择index

df2 = df2.sort_index(level='课程')
df2.loc[('语文',slice(None)),:]

在pandas多重索引multiIndex中选定指定索引的行方法

得到了我们想要的结果。

参考文献:pandas-docs-MultiIndex / Advanced Indexing

以上这篇在pandas多重索引multiIndex中选定指定索引的行方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python中lambda与def用法对比实例分析
Apr 30 Python
python flask 多对多表查询功能
Jun 25 Python
Python基于matplotlib画箱体图检验异常值操作示例【附xls数据文件下载】
Jan 07 Python
Django框架模型简单介绍与使用分析
Jul 18 Python
Python imread、newaxis用法详解
Nov 04 Python
pytorch实现特殊的Module--Sqeuential三种写法
Jan 15 Python
Python实现链表反转的方法分析【迭代法与递归法】
Feb 22 Python
Python图像处理库PIL中图像格式转换的实现
Feb 26 Python
django-orm F对象的使用 按照两个字段的和,乘积排序实例
May 18 Python
Pycharm生成可执行文件.exe的实现方法
Jun 02 Python
Python通过kerberos安全认证操作kafka方式
Jun 06 Python
解决python的空格和tab混淆而报错的问题
Feb 26 Python
对Pandas MultiIndex(多重索引)详解
Nov 16 #Python
一百行python代码将图片转成字符画
Feb 19 #Python
Pandas GroupBy对象 索引与迭代方法
Nov 16 #Python
python实现指定字符串补全空格、前面填充0的方法
Nov 16 #Python
pandas 透视表中文字段排序方法
Nov 16 #Python
用Python实现数据的透视表的方法
Nov 16 #Python
pandas pivot_table() 按日期分多列数据的方法
Nov 16 #Python
You might like
php 变量未定义等错误的解决方法
2011/01/12 PHP
php获取新浪微博数据API实例
2013/11/12 PHP
PHP实现合并两个排序链表的方法
2018/01/19 PHP
微信公众号之主动给用户发送消息功能
2019/06/22 PHP
IE8 原生JSON支持
2009/04/13 Javascript
jQuery EasyUI菜单与按钮详解
2016/07/13 Javascript
js实现获取鼠标当前的位置
2016/12/14 Javascript
js多个物体运动功能实例分析
2016/12/20 Javascript
Bootstrap Table使用整理(二)
2017/06/09 Javascript
浅谈Angular4中常用管道
2017/09/27 Javascript
vue-router路由与页面间导航实例解析
2017/11/07 Javascript
基于打包工具Webpack进行项目开发实例
2018/05/29 Javascript
Vue中$refs的用法详解
2018/06/24 Javascript
详解vue中async-await的使用误区
2018/12/05 Javascript
使用jquery-easyui的布局layout写后台管理页面的代码详解
2019/06/19 jQuery
浅谈Vue3.0之前你必须知道的TypeScript实战技巧
2019/09/11 Javascript
Python中title()方法的使用简介
2015/05/20 Python
Python中for循环和while循环的基本使用方法
2015/08/21 Python
Python卸载模块的方法汇总
2016/06/07 Python
python 生成器生成杨辉三角的方法(必看)
2017/04/10 Python
用Python编写一个简单的CS架构后门的方法
2018/11/20 Python
Python中turtle库的使用实例
2019/09/09 Python
pygame库实现俄罗斯方块小游戏
2019/10/29 Python
让你的Python代码实现类型提示功能
2019/11/19 Python
Python如何向SQLServer存储二进制图片
2020/06/08 Python
pycharm实现猜数游戏
2020/12/07 Python
使用HTML5做个画图板的方法介绍
2013/05/03 HTML / CSS
SQL Server里面什么样的视图才能创建索引
2015/04/17 面试题
婚庆司仪主持词
2014/03/15 职场文书
护理学专业求职信
2014/06/29 职场文书
社区活动策划方案
2014/08/21 职场文书
2014年“世界无车日”活动方案
2014/09/21 职场文书
黑暗中的舞者观后感
2015/06/18 职场文书
致创业的您:这类人不适合餐饮创业
2019/08/19 职场文书
AJAX学习笔记
2021/05/18 Javascript
ztree+ajax实现文件树下载功能
2021/05/18 Javascript