详解pandas DataFrame的查询方法(loc,iloc,at,iat,ix的用法和区别)


Posted in Python onAugust 02, 2019

在操作DataFrame时,肯定会经常用到loc,iloc,at等函数,各个函数看起来差不多,但是还是有很多区别的,我们一起来看下吧。

首先,还是列出一个我们用的DataFrame,注意index一列,如下:

详解pandas DataFrame的查询方法(loc,iloc,at,iat,ix的用法和区别)

接下来,介绍下各个函数的用法:

1、loc函数

愿意看官方文档的,请戳这里,这里一般最权威。
loc函数是基于“标签”选择数据的,但是也可以接受一个boolean的array,对于每个用法,我们从参数方面来一一举例:

1.1 单个label

接受一个“标签”(label)参数,返回一个Series,例如下面这个例子收一个标签,返回通过这个标签定位的行的值,注意这里是通过标签定位,而不是通过中括号中的数字定位第几行,之后我们通过对比iloc函数时还会细说。

test_dict_df.loc[1] #return the row with name 'Bob'
test_dict_df.loc[7] #return the row with name 'Time' important!!!
# type(test_dict_df.loc[1]) #pandas.core.series.Series

1.2 一个label的array

如果键入一个标签的array,那么就返回一个对应的DataFrame:

test_dict_df.loc[[1,2,4]]

结果如下:

详解pandas DataFrame的查询方法(loc,iloc,at,iat,ix的用法和区别)

1.3 加入一个切片array

test_dict_df.loc[[1:4]]

结果如下:

详解pandas DataFrame的查询方法(loc,iloc,at,iat,ix的用法和区别)

1.4 行标签,列标签

通过在中括号中加入行标签和列标签来定位一个cell,相当于坐标的定位:

test_dict_df.loc[1,'english'] #result:94

1.5 行标签或者列标签是切片array

test_dict_df.loc[1:4,'english']
# test_dict_df.loc[1:4,'english':'math']

1.6 还可以接受条件,进行选择

例如我们选择英语成绩超过90的所有行:

test_dict_df.loc[test_dict_df['english']>90]

详解pandas DataFrame的查询方法(loc,iloc,at,iat,ix的用法和区别)

当然,也可以再条件选择后,再加入列选择,列选择的时候可以单列,也可以是切片数组,通过上面的介绍这里就可以灵活处理:

test_dict_df.loc[test_dict_df['english']>90,'english'] #single label
test_dict_df.loc[test_dict_df['english']>90,'english':'name'] #slice array
test_dict_df.loc[test_dict_df['english']>90,['english','name']] #label array

1.7 接受一个boolean的array

可以接受一个boolean的array,相当于按照这个表的真假按照位置的顺序选择值

test_dict_df.loc[[True,False,False,True]]

loc还有很多用法,这里先介绍到这里吧,当然如果你的DataFrame是复合的行或者复合列,写法也是不同的,具体就可以查阅官方文档了!

2、iloc函数

官方文档戳这里。

iloc函数与loc函数不同的是,它接受的是一个数字,代表着要选择数据的位置:

test_dict_df.iloc[6]

这代表我们选择的是第6行,而不是index为6的那一行。当然,也可以接受一个boolean的array,相当于按照这个表的真假按照位置的顺序选择值:

test_dict_df.iloc[[True,False,False,True]]

这里iloc也可以接受切片array:

# test_dict_df.iloc[1:2]
test_dict_df.iloc[[1,2,4]]

3、ix函数(0.20.0版本后已经弃用)

ix就是一种混合索引,字符串的标签和证书的数据索引都可以作为合法输入,其实相当于loc和iloc的一个混合方法:

test_dict_df.ix['Alice']
test_dict_df.ix[1]

上述两种方法都能得到值,这里我们就不追究这个函数具体是怎样的检索顺序或者工作原理了。因为官方给出的是从pandas0.20.0之后,ix函数已经被弃用。其实在使用的时候,ix函数虽然方便,但是的确有时候会显得比较混乱,所以我们之后也尽量少用这个函数吧,还是按照官方大佬的指导。

4、at函数

at是用来选择单个值的,此时用法类似于loc:

test_dict_df.at[1,'english']
test_dict_df.loc[1,'english']

以上两种方法都能选择到,label为1,列为'english'的那个值,但是据说at速度要快,这点我没有考证过。

5、iat函数

iat函数相对于at函数,就相当于iloc相对于loc函数。iat也只能选择一个值。只不过是用索引位置来选择,注意:行列都是索引位置来选择,从0开始数。

# test_dict_df.iat[1,'english'] #error!!!
test_dict_df.iat[2,2] #right!!!

6、概括一下

最后我们概括一下:

1、 loc和iloc函数都是用来选择某行的,iloc与loc的不同是:iloc是按照行索引所在的位置来选取数据,参数只能是整数。而loc是按照索引名称来选取数据,参数类型依索引类型而定;

2、 at和iat函数是只能选择某个位置的值,iat是按照行索引和列索引的位置来选取数据的。而at是按照行索引和列索引来选取数据;

3、 loc和iloc函数的功能包含at和iat函数的功能。

相应的代码连接:github代码

先写到这里,如有新的再补充。

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
简单的Python2.7编程初学经验总结
Apr 01 Python
实例解析Python中的__new__特殊方法
Jun 02 Python
基于python的七种经典排序算法(推荐)
Dec 08 Python
Python使用QRCode模块生成二维码实例详解
Jun 14 Python
python实现简单加密解密机制
Mar 19 Python
使用Django简单编写一个XSS平台的方法步骤
Mar 25 Python
django项目用higcharts统计最近七天文章点击量
Aug 17 Python
python列表推导和生成器表达式知识点总结
Jan 10 Python
python orm 框架中sqlalchemy用法实例详解
Feb 02 Python
Python Selenium安装及环境配置的实现
Mar 17 Python
python如何查看网页代码
Jun 07 Python
Cpython解释器中的GIL全局解释器锁
Nov 09 Python
pandas DataFrame创建方法的方式
Aug 02 #Python
django项目环境搭建及在虚拟机本地创建django项目的教程
Aug 02 #Python
Django缓存系统实现过程解析
Aug 02 #Python
tensor和numpy的互相转换的实现示例
Aug 02 #Python
Django文件存储 自己定制存储系统解析
Aug 02 #Python
使用pycharm在本地开发并实时同步到服务器
Aug 02 #Python
Django文件存储 默认存储系统解析
Aug 02 #Python
You might like
Terran魔法科技
2020/03/14 星际争霸
为什么那些咖啡爱好者大多看不上连锁咖啡店?
2021/03/06 咖啡文化
php实现图片上传并进行替换操作
2016/03/15 PHP
PHP中file_exists使用中遇到的问题小结
2016/04/05 PHP
Javascript计算时间差的函数分享
2011/07/04 Javascript
可简单避免的三个JS发布错误的详细介绍
2013/08/02 Javascript
JavaScript设计模式之外观模式介绍
2014/12/28 Javascript
在DWR中实现直接获取一个JAVA类的返回值的两种方法
2016/12/25 Javascript
js仿微信公众平台打标签功能
2017/04/08 Javascript
seajs模块压缩问题与解决方法实例分析
2017/10/10 Javascript
bootstrap 通过加减按钮实现输入框组功能
2017/11/15 Javascript
从parcel.js打包出错到选择nvm的全部过程
2018/01/23 Javascript
详解.vue文件解析的实现
2018/06/11 Javascript
关于Vue组件库开发详析
2018/07/01 Javascript
在JS循环中使用async/await的方法
2018/10/12 Javascript
深入理解es6块级作用域的使用
2019/03/28 Javascript
ng-alain的sf如何自定义部件的流程
2020/06/12 Javascript
彻底搞懂并解决vue-cli4中图片显示的问题实现
2020/08/31 Javascript
[02:41]DOTA2英雄基础教程 亚巴顿
2014/01/02 DOTA
[03:38]2014DOTA2西雅图国际邀请赛 VG战队巡礼
2014/07/07 DOTA
利用python获取当前日期前后N天或N月日期的方法示例
2017/07/30 Python
virtualenv 指定 python 解释器的版本方法
2018/10/25 Python
python中的print()输出
2019/04/12 Python
Python3 pandas 操作列表实例详解
2019/09/23 Python
pytorch之inception_v3的实现案例
2020/01/06 Python
使用python批量转换文件编码为UTF-8的实现
2020/04/03 Python
如何在windows下安装Pycham2020软件(方法步骤详解)
2020/05/03 Python
Python使用pyexecjs代码案例解析
2020/07/13 Python
Django-Scrapy生成后端json接口的方法示例
2020/10/06 Python
加拿大著名的奢侈品购物网站:SSENSE(支持中文)
2020/06/25 全球购物
2013年大学生的自我鉴定
2013/10/24 职场文书
会计自我鉴定
2013/11/02 职场文书
学雷锋团日活动总结
2015/05/06 职场文书
退休职工欢送会致辞
2015/08/01 职场文书
决心书格式范文
2015/09/23 职场文书
高三生物教学反思
2016/02/22 职场文书