在pandas多重索引multiIndex中选定指定索引的行方法


Posted in Python onNovember 16, 2018

在multiIndex中选定指定索引的行

我们在用pandas类似groupby来使用多重index时,有时想要对多个level中的某个index对应的行进行操作,就需要在dataframe中找到该index对应的行,在单层index中我们可以方便的使用df.loc[index]来选择,在多重Index中我们可以利用的类似的思路,然而其中也有一些小坑,记录如下。

1 index为有序的

1.1 创建测试数据

首先创建一个dataframe数据

df = pd.DataFrame({'class':['A','A','A','B','B','B','C','C'],
   'id':['a','b','c','a','b','c','a','b'],
   'value':[1,2,3,4,5,6,7,8]})

df中内容如下图:

在pandas多重索引multiIndex中选定指定索引的行方法

1.2 设置multiIndex

通过set_index设为多重索引

df = df.set_index(['class','id'])

设置索引后效果:

在pandas多重索引multiIndex中选定指定索引的行方法

1.3 切片筛选index

这里同样使用loc定位

df.loc[('A',slice(None)),:]

各参数的解释如下:

loc[(a,b),c]中第一个参数元组为索引内容,a为level0索引对应的内容,b为level1索引对应的内容

因为df是一个dataframe,所以要用c来指定列

这里‘A',指选择class中的A类

slice(None), 是Python中的切片操作,这里用来选择任意的id,要注意!不能使用‘:'来指定任意index

‘:',用来指定dataframe任意的列

执行后的结果如下:

在pandas多重索引multiIndex中选定指定索引的行方法

同样,如果想只保留id中的'a',则可以使用:

df.loc[(slice(None),'a'),:]

2 index无序

前面的例子对应的index列为数字或字母,是有序的,接下来我们看看index列为中文的情况。

2.1 创建无序测试数据

df2 = pd.DataFrame({'课程':['语文','语文','数学','数学'],'得分':['最高','最低','最高','最低'],'分值':[90,50,100,60]})
df2 = df2.set_index(['课程','得分'])

在pandas多重索引multiIndex中选定指定索引的行方法

2.2 尝试切片选择index

df2.loc[('语文',slice(None)),:]

我们进行同样的操作,这时会发现提示出错:

UnsortedIndexError: 'MultiIndex Slicing requires the index to be fully lexsorted tuple len (2), lexsort depth (0)'

这是因为此时的index无法进行排序,在pandas文档中提到:Furthermore if you try to index something that is not fully lexsorted, this can raise:

我们可以通过 df2.index.is_lexsorted()来检查index是否有序,

In[1]: df2.index.is_lexsorted()
out[1]: False

接下来,我们尝试对Index进行排序。(排序时要在level里指定index名)

2.3 对index排序后切片选择index

df2 = df2.sort_index(level='课程')
df2.loc[('语文',slice(None)),:]

在pandas多重索引multiIndex中选定指定索引的行方法

得到了我们想要的结果。

参考文献:pandas-docs-MultiIndex / Advanced Indexing

以上这篇在pandas多重索引multiIndex中选定指定索引的行方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python算法之栈(stack)的实现
Aug 18 Python
python实现实时监控文件的方法
Aug 26 Python
Python中functools模块函数解析
Mar 12 Python
python批量替换多文件字符串问题详解
Apr 22 Python
Selenium定位元素操作示例
Aug 10 Python
python使用flask与js进行前后台交互的例子
Jul 19 Python
解决使用export_graphviz可视化树报错的问题
Aug 09 Python
使用python写的opencv实时监测和解析二维码和条形码
Aug 14 Python
Python3 读取Word文件方式
Feb 13 Python
python3注册全局热键的实现
Mar 22 Python
如何理解python中数字列表
May 29 Python
Python自动化xpath实现自动抢票抢货
Sep 19 Python
对Pandas MultiIndex(多重索引)详解
Nov 16 #Python
一百行python代码将图片转成字符画
Feb 19 #Python
Pandas GroupBy对象 索引与迭代方法
Nov 16 #Python
python实现指定字符串补全空格、前面填充0的方法
Nov 16 #Python
pandas 透视表中文字段排序方法
Nov 16 #Python
用Python实现数据的透视表的方法
Nov 16 #Python
pandas pivot_table() 按日期分多列数据的方法
Nov 16 #Python
You might like
便携利器 — TECSUN PL-365简评
2021/03/02 无线电
怎么样可以把 phpinfo()屏蔽掉?
2006/11/24 PHP
PHP 读取和修改大文件的某行内容的代码
2009/10/30 PHP
[原创]PHP实现逐行删除文件右侧空格的方法
2015/12/25 PHP
php删除一个路径下的所有文件夹和文件的方法
2018/02/07 PHP
php+laravel依赖注入知识点总结
2019/11/04 PHP
利用404错误页面实现UrlRewrite的实现代码
2008/08/20 Javascript
在Iframe中获取父窗口中表单的值(示例代码)
2013/11/22 Javascript
微信小程序导航栏滑动定位功能示例(实现CSS3的positionsticky效果)
2019/01/24 Javascript
你或许不知道的一些npm实用技巧
2019/07/04 Javascript
jQuery zTree树插件的使用教程
2019/08/16 jQuery
vue-router 中 meta的用法详解
2019/11/01 Javascript
详细分析Node.js 多进程
2020/06/22 Javascript
Python生成密码库功能示例
2017/05/23 Python
PyCharm 常用快捷键和设置方法
2017/12/20 Python
Numpy数组的保存与读取方法
2018/04/04 Python
使用python进行拆分大文件的方法
2018/12/10 Python
浅谈Python采集网页时正则表达式匹配换行符的问题
2018/12/20 Python
python实现一个简单的ping工具方法
2019/01/31 Python
pyqt 实现为长内容添加滑轮 scrollArea
2019/06/19 Python
python实现基于朴素贝叶斯的垃圾分类算法
2019/07/09 Python
Python利用matplotlib绘制约数个数统计图示例
2019/11/26 Python
Python实现线性判别分析(LDA)的MATLAB方式
2019/12/09 Python
Python如何基于rsa模块实现非对称加密与解密
2020/01/03 Python
Pycharm中切换pytorch的环境和配置的教程详解
2020/03/13 Python
Python制作数据预测集成工具(值得收藏)
2020/08/21 Python
快速创建python 虚拟环境
2020/11/28 Python
LA MER海蓝之谜美国官网:传奇面霜
2016/08/27 全球购物
欧洲领先的技术商店:eibmarkt.com
2019/05/10 全球购物
意大利文具和办公产品在线商店:Y-Office
2020/02/27 全球购物
办公室年终个人自我评价
2013/10/28 职场文书
后进生转化工作制度
2014/01/17 职场文书
实践单位评语
2014/04/26 职场文书
道德之星事迹材料
2014/05/03 职场文书
名人演讲稿范文
2014/09/16 职场文书
机关干部作风建设剖析材料
2014/10/23 职场文书