详解pandas如何去掉、过滤数据集中的某些值或者某些行?


Posted in Python onMay 15, 2019

摘要在进行数据分析与清理中,我们可能常常需要在数据集中去掉某些异常值。具体来说,看看下面的例子。

详解pandas如何去掉、过滤数据集中的某些值或者某些行?

0.导入我们需要使用的包

import pandas as pd

pandas是很常用的数据分析,数据处理的包。anaconda已经有这个包了,纯净版python的可以自行pip安装。

1.去掉某些具体值

数据集df中,对于属性appPlatform(最后一列),我们想删除掉取值为2的那些样本。如何做?非常简单。

import pandas as pd

df[(True-df['appPlatform'].isin([2]))]

详解pandas如何去掉、过滤数据集中的某些值或者某些行?

当然,有时候我们需要去掉不止一个值,这个时候只需要在isin([])的列表中添加。更具体来说,例如,对于appID这个属性,我们想去掉appID=278和appID=382的样本。

df[(True-df['appID'].isin([278,382]))]

详解pandas如何去掉、过滤数据集中的某些值或者某些行?

另外,我们有时候并不只是考虑某一列,还需要考虑另外若干列的情况。例如,我们需要过滤掉appPlatform=2而且appID=278和appID=382的样本呢?非常简单。

df[(True-df['appID'].isin([278,382]))&(True-df['appPlatform'].isin([2]))]

其实,在这里我们看到,就是由两部分组成的,第一部分就是appID中等于278和382的,另外一部分就是appPlatform中等于2的。两者取逻辑关系 与(&)

详解pandas如何去掉、过滤数据集中的某些值或者某些行?

2.过滤掉某个范围的值

上面我们是了解了如何取掉某个具体值,下面,我们要看看如何过滤掉某个范围的值。对于数据集df,我们想过滤掉creativeID(第一列)中ID值大于10000的样本。

df[df['creativeID']<=10000]

详解pandas如何去掉、过滤数据集中的某些值或者某些行?

另外,如果要考虑多列的话,其实和上面一样,将两种情况做逻辑与(&)就可以,不过值得注意的是,每个条件要用括号()括起来。

以上所述是小编给大家介绍的pandas如何去掉、过滤数据集中的某些值或者某些行详解整合,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对三水点靠木网站的支持!

Python 相关文章推荐
使用python编写android截屏脚本双击运行即可
Jul 21 Python
Python缩进和冒号详解
Jun 01 Python
对Python捕获控制台输出流的方法详解
Jan 07 Python
一篇文章了解Python中常见的序列化操作
Jun 20 Python
详解pandas中MultiIndex和对象实际索引不一致问题
Jul 23 Python
django如何实现视图重定向
Jul 24 Python
Django Rest framework三种分页方式详解
Jul 26 Python
python线程的几种创建方式详解
Aug 29 Python
Python如何使用argparse模块处理命令行参数
Dec 11 Python
Pycharm 2020最新永久激活码(附最新激活码和插件)
Sep 17 Python
python实现定时发送邮件
Dec 23 Python
Python字节单位转换(将字节转换为K M G T)
Mar 02 Python
详解Python列表赋值复制深拷贝及5种浅拷贝
May 15 #Python
Python 20行简单实现有道在线翻译的详解
May 15 #Python
Python中的字符串切片(截取字符串)的详解
May 15 #Python
python3 property装饰器实现原理与用法示例
May 15 #Python
详解Python下载图片并保存本地的两种方式
May 15 #Python
Python常用模块之requests模块用法分析
May 15 #Python
Django框架实现的普通登录案例【使用POST方法】
May 15 #Python
You might like
基于OpenCV的PHP图像人脸识别技术
2009/10/11 PHP
php下通过IP获取地理位置的代码(小偷程序)
2011/06/09 PHP
PHP基于简单递归函数求一个数阶乘的方法示例
2017/04/26 PHP
Laravel jwt 多表(多用户端)验证隔离的实现
2019/12/18 PHP
第一个JavaScript入门基础 document.write输出
2010/02/22 Javascript
Jquery工作常用实例 使用AJAX使网页进行异步更新
2011/07/26 Javascript
使用jQuery异步加载 JavaScript脚本解决方案
2014/04/20 Javascript
js动态改变select选择变更option的index值示例
2014/07/10 Javascript
JS实现可缩放、拖动、关闭和最小化的浮动窗口完整实例
2015/03/04 Javascript
js和jQuery以及easyui实现对下拉框的指定赋值方法
2018/01/23 jQuery
为jquery的ajax请求添加超时timeout时间的操作方法
2018/09/04 jQuery
基于AngularJs select绑定数字类型的问题
2018/10/08 Javascript
angularjs通过过滤器返回超链接的方法
2018/10/26 Javascript
浅谈js中的bind
2019/03/18 Javascript
[03:18]DOTA2亚洲邀请赛小组赛第一日 RECAP赛事回顾
2015/01/30 DOTA
[01:11:21]DOTA2-DPC中国联赛 正赛 Phoenix vs CDEC BO3 第三场 3月7日
2021/03/11 DOTA
Python 搭建Web站点之Web服务器网关接口
2016/11/06 Python
python将每个单词按空格分开并保存到文件中
2018/03/19 Python
python 多线程中子线程和主线程相互通信方法
2018/11/09 Python
使用TensorFlow实现二分类的方法示例
2019/02/05 Python
python使用pymongo操作mongo的完整步骤
2019/04/13 Python
python实现串口通信的示例代码
2020/02/10 Python
深入了解python列表(LIST)
2020/06/08 Python
python实现感知机模型的示例
2020/09/30 Python
Python中正则表达式对单个字符,多个字符和匹配边界等使用
2021/01/27 Python
美国一家主打母婴用品的团购网站:zulily
2017/09/19 全球购物
蔻驰西班牙官网:COACH西班牙
2019/01/16 全球购物
我的求职计划书
2014/01/10 职场文书
工程质量月活动方案
2014/02/19 职场文书
党员教师一句话承诺
2014/05/30 职场文书
大学专科自荐信
2014/06/17 职场文书
中学生检讨书范文
2014/11/03 职场文书
名人传读书笔记
2015/06/26 职场文书
远程教育培训心得体会
2016/01/09 职场文书
2016年中学端午节主题活动总结
2016/04/01 职场文书
Python循环之while无限迭代
2022/04/30 Python