详解pandas如何去掉、过滤数据集中的某些值或者某些行?


Posted in Python onMay 15, 2019

摘要在进行数据分析与清理中,我们可能常常需要在数据集中去掉某些异常值。具体来说,看看下面的例子。

详解pandas如何去掉、过滤数据集中的某些值或者某些行?

0.导入我们需要使用的包

import pandas as pd

pandas是很常用的数据分析,数据处理的包。anaconda已经有这个包了,纯净版python的可以自行pip安装。

1.去掉某些具体值

数据集df中,对于属性appPlatform(最后一列),我们想删除掉取值为2的那些样本。如何做?非常简单。

import pandas as pd

df[(True-df['appPlatform'].isin([2]))]

详解pandas如何去掉、过滤数据集中的某些值或者某些行?

当然,有时候我们需要去掉不止一个值,这个时候只需要在isin([])的列表中添加。更具体来说,例如,对于appID这个属性,我们想去掉appID=278和appID=382的样本。

df[(True-df['appID'].isin([278,382]))]

详解pandas如何去掉、过滤数据集中的某些值或者某些行?

另外,我们有时候并不只是考虑某一列,还需要考虑另外若干列的情况。例如,我们需要过滤掉appPlatform=2而且appID=278和appID=382的样本呢?非常简单。

df[(True-df['appID'].isin([278,382]))&(True-df['appPlatform'].isin([2]))]

其实,在这里我们看到,就是由两部分组成的,第一部分就是appID中等于278和382的,另外一部分就是appPlatform中等于2的。两者取逻辑关系 与(&)

详解pandas如何去掉、过滤数据集中的某些值或者某些行?

2.过滤掉某个范围的值

上面我们是了解了如何取掉某个具体值,下面,我们要看看如何过滤掉某个范围的值。对于数据集df,我们想过滤掉creativeID(第一列)中ID值大于10000的样本。

df[df['creativeID']<=10000]

详解pandas如何去掉、过滤数据集中的某些值或者某些行?

另外,如果要考虑多列的话,其实和上面一样,将两种情况做逻辑与(&)就可以,不过值得注意的是,每个条件要用括号()括起来。

以上所述是小编给大家介绍的pandas如何去掉、过滤数据集中的某些值或者某些行详解整合,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对三水点靠木网站的支持!

Python 相关文章推荐
详解Python中的正则表达式
Jul 08 Python
详解django自定义中间件处理
Nov 21 Python
解决Python找不到ssl模块问题 No module named _ssl的方法
Apr 29 Python
python实现微信机器人: 登录微信、消息接收、自动回复功能
Apr 29 Python
Python实现FTP文件传输的实例
Jul 07 Python
pd.DataFrame统计各列数值多少的实例
Dec 05 Python
python可视化text()函数使用详解
Feb 11 Python
Python 实现日志同时输出到屏幕和文件
Feb 19 Python
python字符串判断密码强弱
Mar 18 Python
Python通过kerberos安全认证操作kafka方式
Jun 06 Python
Java如何基于wsimport调用wcf接口
Jun 17 Python
Python django中如何使用restful框架
Jun 23 Python
详解Python列表赋值复制深拷贝及5种浅拷贝
May 15 #Python
Python 20行简单实现有道在线翻译的详解
May 15 #Python
Python中的字符串切片(截取字符串)的详解
May 15 #Python
python3 property装饰器实现原理与用法示例
May 15 #Python
详解Python下载图片并保存本地的两种方式
May 15 #Python
Python常用模块之requests模块用法分析
May 15 #Python
Django框架实现的普通登录案例【使用POST方法】
May 15 #Python
You might like
espresso double下 咖啡粉超细时 饼压力对咖啡的影响
2021/03/03 冲泡冲煮
用PHP查询搜索引擎排名位置的代码
2010/01/05 PHP
PHP+JS+rsa数据加密传输实现代码
2011/03/23 PHP
在 Laravel 中 “规范” 的开发短信验证码发送功能
2017/10/26 PHP
用js实现的检测浏览器和系统的函数
2009/04/09 Javascript
jquery 输入框数字限制插件
2009/11/10 Javascript
JS操作图片(增,删,改) 例子
2013/04/17 Javascript
JavaScript实现页面5秒后自动跳转的方法
2015/04/16 Javascript
js实现3D图片逐张轮播幻灯片特效代码分享
2015/09/09 Javascript
理解javascript闭包
2015/12/15 Javascript
Js删除数组中某一项或几项的几种方法(推荐)
2016/07/27 Javascript
轻松掌握JavaScript享元模式
2016/08/27 Javascript
Angular.js中window.onload(),$(document).ready()的写法浅析
2017/09/28 Javascript
Node使用Sequlize连接Mysql报错:Access denied for user ‘xxx’@‘localhost’
2018/01/03 Javascript
vue 国际化 vue-i18n 双语言 语言包
2018/06/07 Javascript
Vue触发式全局组件构建的方法
2018/11/28 Javascript
Openlayers实现测量功能
2020/09/25 Javascript
[02:16]完美世界DOTA2联赛PWL S3 集锦第三期
2020/12/21 DOTA
python的类方法和静态方法
2014/12/13 Python
基础的十进制按位运算总结与在Python中的计算示例
2016/06/28 Python
Python生成器以及应用实例解析
2018/02/08 Python
PyCharm+PySpark远程调试的环境配置的方法
2018/11/29 Python
钉钉群自定义机器人消息Python封装的实例
2019/02/20 Python
运用PyTorch动手搭建一个共享单车预测器
2019/08/06 Python
Python中顺序表原理与实现方法详解
2019/12/03 Python
WiFi云数码相框:Nixplay
2018/07/05 全球购物
eBay意大利购物网站:eBay.it
2019/09/04 全球购物
mysql有关权限的表都有哪几个
2015/04/22 面试题
教你打造完美的创业计划书
2014/01/06 职场文书
工程采购员岗位职责
2014/03/09 职场文书
竞选学生会主席演讲稿
2014/04/24 职场文书
保护地球的标语
2014/06/17 职场文书
党员证明模板
2015/06/19 职场文书
导游词幽默开场白
2019/06/26 职场文书
再读《皇帝的新衣》的读后感悟!
2019/08/07 职场文书
Java 定时任务技术趋势简介
2022/05/04 Java/Android