详解pandas如何去掉、过滤数据集中的某些值或者某些行?


Posted in Python onMay 15, 2019

摘要在进行数据分析与清理中,我们可能常常需要在数据集中去掉某些异常值。具体来说,看看下面的例子。

详解pandas如何去掉、过滤数据集中的某些值或者某些行?

0.导入我们需要使用的包

import pandas as pd

pandas是很常用的数据分析,数据处理的包。anaconda已经有这个包了,纯净版python的可以自行pip安装。

1.去掉某些具体值

数据集df中,对于属性appPlatform(最后一列),我们想删除掉取值为2的那些样本。如何做?非常简单。

import pandas as pd

df[(True-df['appPlatform'].isin([2]))]

详解pandas如何去掉、过滤数据集中的某些值或者某些行?

当然,有时候我们需要去掉不止一个值,这个时候只需要在isin([])的列表中添加。更具体来说,例如,对于appID这个属性,我们想去掉appID=278和appID=382的样本。

df[(True-df['appID'].isin([278,382]))]

详解pandas如何去掉、过滤数据集中的某些值或者某些行?

另外,我们有时候并不只是考虑某一列,还需要考虑另外若干列的情况。例如,我们需要过滤掉appPlatform=2而且appID=278和appID=382的样本呢?非常简单。

df[(True-df['appID'].isin([278,382]))&(True-df['appPlatform'].isin([2]))]

其实,在这里我们看到,就是由两部分组成的,第一部分就是appID中等于278和382的,另外一部分就是appPlatform中等于2的。两者取逻辑关系 与(&)

详解pandas如何去掉、过滤数据集中的某些值或者某些行?

2.过滤掉某个范围的值

上面我们是了解了如何取掉某个具体值,下面,我们要看看如何过滤掉某个范围的值。对于数据集df,我们想过滤掉creativeID(第一列)中ID值大于10000的样本。

df[df['creativeID']<=10000]

详解pandas如何去掉、过滤数据集中的某些值或者某些行?

另外,如果要考虑多列的话,其实和上面一样,将两种情况做逻辑与(&)就可以,不过值得注意的是,每个条件要用括号()括起来。

以上所述是小编给大家介绍的pandas如何去掉、过滤数据集中的某些值或者某些行详解整合,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对三水点靠木网站的支持!

Python 相关文章推荐
利用Python和OpenCV库将URL转换为OpenCV格式的方法
Mar 27 Python
python3使用urllib模块制作网络爬虫
Apr 08 Python
Python操作SQLite数据库的方法详解
Jun 16 Python
Python基于matplotlib实现绘制三维图形功能示例
Jan 18 Python
Django自定义manage命令实例代码
Feb 11 Python
Python中base64与xml取值结合问题
Dec 22 Python
详解基于Jupyter notebooks采用sklearn库实现多元回归方程编程
Mar 25 Python
keras自定义回调函数查看训练的loss和accuracy方式
May 23 Python
Python简单实现词云图代码及步骤解析
Jun 04 Python
Python引入多个模块及包的概念过程解析
Sep 21 Python
python 如何将office文件转换为PDF
Sep 22 Python
关于Numpy之repeat、tile的用法总结
Jun 02 Python
详解Python列表赋值复制深拷贝及5种浅拷贝
May 15 #Python
Python 20行简单实现有道在线翻译的详解
May 15 #Python
Python中的字符串切片(截取字符串)的详解
May 15 #Python
python3 property装饰器实现原理与用法示例
May 15 #Python
详解Python下载图片并保存本地的两种方式
May 15 #Python
Python常用模块之requests模块用法分析
May 15 #Python
Django框架实现的普通登录案例【使用POST方法】
May 15 #Python
You might like
PHP静态调用非静态方法的应用分析
2013/05/02 PHP
解析php函数method_exists()与is_callable()的区别
2013/06/21 PHP
php过滤表单提交的html等危险代码
2014/11/03 PHP
Laravel 5框架学习之Laravel入门和新建项目
2015/04/07 PHP
Yii2创建多界面主题(Theme)的方法
2016/10/08 PHP
IE和Mozilla的兼容性汇总event
2007/08/12 Javascript
JavaScript代码应该放在HTML代码哪个位置比较好?
2014/10/16 Javascript
JavaScript中的迭代器和生成器详解
2014/10/29 Javascript
基于javascript实现动态时钟效果
2020/08/18 Javascript
Angular 根据 service 的状态更新 directive
2016/04/03 Javascript
jQuery实现文章图片弹出放大效果
2017/04/06 jQuery
JavaScript中常见的八个陷阱总结
2017/06/28 Javascript
详解vue移动端日期选择组件
2018/02/22 Javascript
微信小程序搭建(mpvue+mpvue-weui+fly.js)的详细步骤
2018/09/18 Javascript
[原创]微信小程序获取网络类型的方法示例
2019/03/01 Javascript
JavaScript实现点击图片换背景
2020/11/20 Javascript
C#返回当前系统所有可用驱动器符号的方法
2015/04/18 Python
python嵌套字典比较值与取值的实现示例
2017/11/03 Python
django加载本地html的方法
2018/05/27 Python
python实现指定文件夹下的指定文件移动到指定位置
2018/09/17 Python
初探利用Python进行图文识别(OCR)
2019/02/26 Python
pycharm创建一个python包方法图解
2019/04/10 Python
python启动应用程序和终止应用程序的方法
2019/06/28 Python
简述python&amp;pytorch 随机种子的实现
2020/10/07 Python
CSS3中的content属性使用示例
2015/07/20 HTML / CSS
html5 div布局与table布局详解
2016/11/16 HTML / CSS
英国时尚家具、家居饰品及礼品商店:Graham & Green
2016/09/15 全球购物
以下为Windows NT 下的32 位C++程序,请计算sizeof 的值
2016/12/07 面试题
师范大学音乐表演专业求职信
2013/10/23 职场文书
经销商培训邀请函
2014/01/21 职场文书
保证书范文大全
2014/04/28 职场文书
2014年自愿离婚协议书范本
2014/09/25 职场文书
2014年幼儿园后勤工作总结
2014/11/10 职场文书
博士给导师的自荐信
2015/03/06 职场文书
2015年食品安全工作总结
2015/05/15 职场文书
2016年教师反腐倡廉心得体会
2016/01/13 职场文书