详解pandas如何去掉、过滤数据集中的某些值或者某些行?


Posted in Python onMay 15, 2019

摘要在进行数据分析与清理中,我们可能常常需要在数据集中去掉某些异常值。具体来说,看看下面的例子。

详解pandas如何去掉、过滤数据集中的某些值或者某些行?

0.导入我们需要使用的包

import pandas as pd

pandas是很常用的数据分析,数据处理的包。anaconda已经有这个包了,纯净版python的可以自行pip安装。

1.去掉某些具体值

数据集df中,对于属性appPlatform(最后一列),我们想删除掉取值为2的那些样本。如何做?非常简单。

import pandas as pd

df[(True-df['appPlatform'].isin([2]))]

详解pandas如何去掉、过滤数据集中的某些值或者某些行?

当然,有时候我们需要去掉不止一个值,这个时候只需要在isin([])的列表中添加。更具体来说,例如,对于appID这个属性,我们想去掉appID=278和appID=382的样本。

df[(True-df['appID'].isin([278,382]))]

详解pandas如何去掉、过滤数据集中的某些值或者某些行?

另外,我们有时候并不只是考虑某一列,还需要考虑另外若干列的情况。例如,我们需要过滤掉appPlatform=2而且appID=278和appID=382的样本呢?非常简单。

df[(True-df['appID'].isin([278,382]))&(True-df['appPlatform'].isin([2]))]

其实,在这里我们看到,就是由两部分组成的,第一部分就是appID中等于278和382的,另外一部分就是appPlatform中等于2的。两者取逻辑关系 与(&)

详解pandas如何去掉、过滤数据集中的某些值或者某些行?

2.过滤掉某个范围的值

上面我们是了解了如何取掉某个具体值,下面,我们要看看如何过滤掉某个范围的值。对于数据集df,我们想过滤掉creativeID(第一列)中ID值大于10000的样本。

df[df['creativeID']<=10000]

详解pandas如何去掉、过滤数据集中的某些值或者某些行?

另外,如果要考虑多列的话,其实和上面一样,将两种情况做逻辑与(&)就可以,不过值得注意的是,每个条件要用括号()括起来。

以上所述是小编给大家介绍的pandas如何去掉、过滤数据集中的某些值或者某些行详解整合,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对三水点靠木网站的支持!

Python 相关文章推荐
python实现DES加密解密方法实例详解
Jun 30 Python
在Python的Django框架中为代码添加注释的方法
Jul 16 Python
Python中matplotlib中文乱码解决办法
May 12 Python
AI人工智能 Python实现人机对话
Nov 13 Python
Python实现在某个数组中查找一个值的算法示例
Jun 27 Python
Python匿名函数及应用示例
Apr 09 Python
Python closure闭包解释及其注意点详解
Aug 28 Python
Python手绘可视化工具cutecharts使用实例
Dec 05 Python
python实现加密的方式总结
Jan 19 Python
使用jupyter notebook直接打开.md格式的文件
Apr 10 Python
python中逻辑与或(and、or)和按位与或异或(&amp;、|、^)区别
Aug 05 Python
通过实例解析python subprocess模块原理及用法
Oct 10 Python
详解Python列表赋值复制深拷贝及5种浅拷贝
May 15 #Python
Python 20行简单实现有道在线翻译的详解
May 15 #Python
Python中的字符串切片(截取字符串)的详解
May 15 #Python
python3 property装饰器实现原理与用法示例
May 15 #Python
详解Python下载图片并保存本地的两种方式
May 15 #Python
Python常用模块之requests模块用法分析
May 15 #Python
Django框架实现的普通登录案例【使用POST方法】
May 15 #Python
You might like
Excel数据导入Mysql数据库的实现代码
2008/06/05 PHP
CodeIgniter针对lighttpd服务器URL重写的方法
2015/06/10 PHP
php多文件打包下载的实例代码
2017/07/12 PHP
javascript下过滤数组重复值的代码
2007/09/10 Javascript
ie和firefox不兼容的解决方法集合
2009/04/28 Javascript
JQuery与Ajax常用代码实现对比
2009/10/03 Javascript
js正则表达式中test,exec,match方法的区别说明
2014/01/29 Javascript
AngularJS中的模块详解
2015/01/29 Javascript
js拖拽的原型声明和用法总结
2016/04/04 Javascript
JQuery的attr 与 val区别
2016/06/12 Javascript
JavaScript中Array的实用操作技巧分享
2016/09/11 Javascript
bootstrap laydate日期组件使用详解
2017/01/04 Javascript
vue页面使用阿里oss上传功能的实例(一)
2017/08/09 Javascript
vue实现验证码按钮倒计时功能
2018/04/10 Javascript
轻松解决JavaScript定时器越走越快的问题
2019/05/13 Javascript
React组件设计模式之组合组件应用实例分析
2020/04/29 Javascript
[01:13:17]Secret vs NB 2018国际邀请赛小组赛BO2 第二场 8.19
2018/08/21 DOTA
python使用cookie库操保存cookie详解
2014/03/03 Python
Python中list的交、并、差集获取方法示例
2019/08/01 Python
python实现简单日志记录库glog的使用
2019/12/13 Python
Tensorflow训练模型越来越慢的2种解决方案
2020/02/07 Python
Python基于pyecharts实现关联图绘制
2020/03/27 Python
工程概预算专业毕业生求职信
2013/10/04 职场文书
法定代表人授权委托书
2014/04/04 职场文书
《桃林那间小木屋》教学反思
2014/05/01 职场文书
国旗下讲话演讲稿
2014/05/08 职场文书
投资建议书模板
2014/05/12 职场文书
奖金申请报告模板
2015/05/15 职场文书
办公室年度工作总结2015
2015/05/21 职场文书
投诉信范文
2015/07/02 职场文书
Python如何使用logging为Flask增加logid
2021/03/30 Python
Golang二维切片初始化的实现
2021/04/08 Golang
详解Oracle块修改跟踪功能
2021/11/07 Oracle
生命的关键成分来自太空?陨石说是的
2022/04/29 数码科技
使用Nginx+Tomcat实现负载均衡的全过程
2022/05/30 Servers
Python编写车票订购系统 Python实现快递收费系统
2022/08/14 Python