详解pandas如何去掉、过滤数据集中的某些值或者某些行?


Posted in Python onMay 15, 2019

摘要在进行数据分析与清理中,我们可能常常需要在数据集中去掉某些异常值。具体来说,看看下面的例子。

详解pandas如何去掉、过滤数据集中的某些值或者某些行?

0.导入我们需要使用的包

import pandas as pd

pandas是很常用的数据分析,数据处理的包。anaconda已经有这个包了,纯净版python的可以自行pip安装。

1.去掉某些具体值

数据集df中,对于属性appPlatform(最后一列),我们想删除掉取值为2的那些样本。如何做?非常简单。

import pandas as pd

df[(True-df['appPlatform'].isin([2]))]

详解pandas如何去掉、过滤数据集中的某些值或者某些行?

当然,有时候我们需要去掉不止一个值,这个时候只需要在isin([])的列表中添加。更具体来说,例如,对于appID这个属性,我们想去掉appID=278和appID=382的样本。

df[(True-df['appID'].isin([278,382]))]

详解pandas如何去掉、过滤数据集中的某些值或者某些行?

另外,我们有时候并不只是考虑某一列,还需要考虑另外若干列的情况。例如,我们需要过滤掉appPlatform=2而且appID=278和appID=382的样本呢?非常简单。

df[(True-df['appID'].isin([278,382]))&(True-df['appPlatform'].isin([2]))]

其实,在这里我们看到,就是由两部分组成的,第一部分就是appID中等于278和382的,另外一部分就是appPlatform中等于2的。两者取逻辑关系 与(&)

详解pandas如何去掉、过滤数据集中的某些值或者某些行?

2.过滤掉某个范围的值

上面我们是了解了如何取掉某个具体值,下面,我们要看看如何过滤掉某个范围的值。对于数据集df,我们想过滤掉creativeID(第一列)中ID值大于10000的样本。

df[df['creativeID']<=10000]

详解pandas如何去掉、过滤数据集中的某些值或者某些行?

另外,如果要考虑多列的话,其实和上面一样,将两种情况做逻辑与(&)就可以,不过值得注意的是,每个条件要用括号()括起来。

以上所述是小编给大家介绍的pandas如何去掉、过滤数据集中的某些值或者某些行详解整合,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对三水点靠木网站的支持!

Python 相关文章推荐
python连接远程ftp服务器并列出目录下文件的方法
Apr 01 Python
python类装饰器用法实例
Jun 04 Python
详解python使用Nginx和uWSGI来运行Python应用
Jan 09 Python
Python使用遗传算法解决最大流问题
Jan 29 Python
python使用锁访问共享变量实例解析
Feb 08 Python
Python with用法:自动关闭文件进程
Jul 10 Python
如何安装并使用conda指令管理python环境
Jul 10 Python
python3 map函数和filter函数详解
Aug 26 Python
python验证码图片处理(二值化)
Nov 01 Python
Python求解正态分布置信区间教程
Nov 20 Python
Python autoescape标签用法解析
Jan 17 Python
Python变量作用域LEGB用法解析
Feb 04 Python
详解Python列表赋值复制深拷贝及5种浅拷贝
May 15 #Python
Python 20行简单实现有道在线翻译的详解
May 15 #Python
Python中的字符串切片(截取字符串)的详解
May 15 #Python
python3 property装饰器实现原理与用法示例
May 15 #Python
详解Python下载图片并保存本地的两种方式
May 15 #Python
Python常用模块之requests模块用法分析
May 15 #Python
Django框架实现的普通登录案例【使用POST方法】
May 15 #Python
You might like
用PHP连接MySQL代码的参数说明
2008/06/07 PHP
php cc攻击代码与防范方法
2012/10/18 PHP
PHP批量获取网页中所有固定种子链接的方法
2016/11/18 PHP
解决thinkPHP 5 nginx 部署时,只跳转首页的问题
2019/10/16 PHP
js调用iframe实现打印页面内容的方法
2014/03/04 Javascript
jQuery中trigger()方法用法实例
2015/01/19 Javascript
JS实现图片产生波纹一样flash效果的方法
2015/02/27 Javascript
使用jquery制作弹出框效果
2015/04/03 Javascript
JQuery实现简单的图片滑动切换特效
2015/11/22 Javascript
JS折半插入排序算法实例
2015/12/02 Javascript
javascript中的3种继承实现方法
2016/01/27 Javascript
JS中dom0级事件和dom2级事件的区别介绍
2016/05/05 Javascript
JS实现简单拖拽效果
2017/06/21 Javascript
AngularJS实现的鼠标拖动画矩形框示例【可兼容IE8】
2019/05/17 Javascript
Node.js安装详细步骤教程(Windows版)详解
2019/09/01 Javascript
jQuery实现鼠标滑动切换图片
2020/05/27 jQuery
[02:34]2016完美“圣”典风云人物:BurNIng专访
2016/12/10 DOTA
RC4文件加密的python实现方法
2015/06/30 Python
Python端口扫描简单程序
2016/11/10 Python
基于python内置函数与匿名函数详解
2018/01/09 Python
Python多项式回归的实现方法
2019/03/11 Python
Selenium+Python 自动化操控登录界面实例(有简单验证码图片校验)
2019/06/28 Python
Python assert关键字原理及实例解析
2019/12/13 Python
windows10环境下用anaconda和VScode配置的图文教程
2020/03/30 Python
使用pandas实现筛选出指定列值所对应的行
2020/12/13 Python
如何用python批量调整视频声音
2020/12/22 Python
广告设计专业自荐信范文
2013/11/14 职场文书
上学迟到的检讨书
2014/01/11 职场文书
写自荐信三大法宝
2014/01/24 职场文书
致百米运动员广播稿
2014/01/29 职场文书
宿舍违规用电检讨书
2014/02/16 职场文书
护林防火标语
2014/06/27 职场文书
搞笑的获奖感言
2014/08/16 职场文书
党的群众路线教育实践活动心得体会(企业)
2014/11/03 职场文书
文明单位申报材料
2014/12/23 职场文书
灵山大佛导游词
2015/02/04 职场文书