详解pandas如何去掉、过滤数据集中的某些值或者某些行?


Posted in Python onMay 15, 2019

摘要在进行数据分析与清理中,我们可能常常需要在数据集中去掉某些异常值。具体来说,看看下面的例子。

详解pandas如何去掉、过滤数据集中的某些值或者某些行?

0.导入我们需要使用的包

import pandas as pd

pandas是很常用的数据分析,数据处理的包。anaconda已经有这个包了,纯净版python的可以自行pip安装。

1.去掉某些具体值

数据集df中,对于属性appPlatform(最后一列),我们想删除掉取值为2的那些样本。如何做?非常简单。

import pandas as pd

df[(True-df['appPlatform'].isin([2]))]

详解pandas如何去掉、过滤数据集中的某些值或者某些行?

当然,有时候我们需要去掉不止一个值,这个时候只需要在isin([])的列表中添加。更具体来说,例如,对于appID这个属性,我们想去掉appID=278和appID=382的样本。

df[(True-df['appID'].isin([278,382]))]

详解pandas如何去掉、过滤数据集中的某些值或者某些行?

另外,我们有时候并不只是考虑某一列,还需要考虑另外若干列的情况。例如,我们需要过滤掉appPlatform=2而且appID=278和appID=382的样本呢?非常简单。

df[(True-df['appID'].isin([278,382]))&(True-df['appPlatform'].isin([2]))]

其实,在这里我们看到,就是由两部分组成的,第一部分就是appID中等于278和382的,另外一部分就是appPlatform中等于2的。两者取逻辑关系 与(&)

详解pandas如何去掉、过滤数据集中的某些值或者某些行?

2.过滤掉某个范围的值

上面我们是了解了如何取掉某个具体值,下面,我们要看看如何过滤掉某个范围的值。对于数据集df,我们想过滤掉creativeID(第一列)中ID值大于10000的样本。

df[df['creativeID']<=10000]

详解pandas如何去掉、过滤数据集中的某些值或者某些行?

另外,如果要考虑多列的话,其实和上面一样,将两种情况做逻辑与(&)就可以,不过值得注意的是,每个条件要用括号()括起来。

以上所述是小编给大家介绍的pandas如何去掉、过滤数据集中的某些值或者某些行详解整合,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对三水点靠木网站的支持!

Python 相关文章推荐
python根据开头和结尾字符串获取中间字符串的方法
Mar 26 Python
从Python的源码来解析Python下的freeblock
May 11 Python
Python使用当前时间、随机数产生一个唯一数字的方法
Sep 18 Python
python音频处理用到的操作的示例代码
Oct 27 Python
matplotlib subplots 调整子图间矩的实例
May 25 Python
Python正则匹配判断手机号是否合法的方法
Dec 09 Python
python实现剪切功能
Jan 23 Python
哈工大自然语言处理工具箱之ltp在windows10下的安装使用教程
May 07 Python
python 输入字符串生成所有有效的IP地址(LeetCode 93号题)
Oct 15 Python
python 下载文件的几种方法汇总
Jan 06 Python
Python3+PyCharm+Django+Django REST framework配置与简单开发教程
Feb 16 Python
pytorch锁死在dataloader(训练时卡死)
May 28 Python
详解Python列表赋值复制深拷贝及5种浅拷贝
May 15 #Python
Python 20行简单实现有道在线翻译的详解
May 15 #Python
Python中的字符串切片(截取字符串)的详解
May 15 #Python
python3 property装饰器实现原理与用法示例
May 15 #Python
详解Python下载图片并保存本地的两种方式
May 15 #Python
Python常用模块之requests模块用法分析
May 15 #Python
Django框架实现的普通登录案例【使用POST方法】
May 15 #Python
You might like
在云虚拟主机部署thinkphp5项目的步骤详解
2017/12/21 PHP
PHP的mysqli_sqlstate()函数讲解
2019/01/23 PHP
在textarea中屏蔽js的某个function的javascript代码
2007/04/20 Javascript
用jquery实现学校的校历(asp.net+jquery ui 1.72)
2010/01/01 Javascript
cnblogs 代码高亮显示后的代码复制问题解决实现代码
2011/12/14 Javascript
jquery子元素过滤选择器使用示例
2013/06/24 Javascript
JS正则验证邮箱的格式详细介绍
2013/11/19 Javascript
JS修改iframe页面背景颜色的方法
2015/04/01 Javascript
Javascript监视变量变化的方法
2015/06/09 Javascript
Bootstrap创建可折叠的组件
2016/02/23 Javascript
javascript闭包概念简单解析(推荐)
2016/06/03 Javascript
Node.js 日志处理模块log4js
2016/08/28 Javascript
html+javascript+bootstrap实现层级多选框全层全选和多选功能
2017/03/09 Javascript
详解vue-router 2.0 常用基础知识点之router.push()
2017/05/10 Javascript
vue使用drag与drop实现拖拽的示例代码
2017/09/07 Javascript
详解node.js中的npm和webpack配置方法
2018/01/21 Javascript
Vue Router的懒加载路径的解决方法
2018/06/21 Javascript
使用PreloadJS加载图片资源的基础方法详解
2020/02/03 Javascript
微信小程序抽奖组件的使用步骤
2021/01/11 Javascript
[05:46]DOTA2英雄梦之声_第18期_陈
2014/06/20 DOTA
[00:17]天涯墨客一技能展示
2018/08/25 DOTA
Python调用系统底层API播放wav文件的方法
2017/08/11 Python
Python实现可设置持续运行时间、线程数及时间间隔的多线程异步post请求功能
2018/01/11 Python
wxPython之解决闪烁的问题
2018/01/15 Python
TensorFlow如何实现反向传播
2018/02/06 Python
Django forms组件的使用教程
2018/10/08 Python
通过shell+python实现企业微信预警
2019/03/07 Python
Django自定义模板过滤器和标签的实现方法
2019/08/21 Python
python实现对列表中的元素进行倒序打印
2019/11/23 Python
GOOD AMERICAN官网:为曲线性感而设计
2017/12/28 全球购物
银行出纳岗位职责
2013/11/25 职场文书
信息系统专业个人求职信范文
2013/12/07 职场文书
英语三分钟演讲稿
2014/08/19 职场文书
党员群众路线教育实践活动学习笔记
2014/11/05 职场文书
奖学金感谢信
2015/01/21 职场文书
祝酒词范文
2015/08/12 职场文书