详解pandas如何去掉、过滤数据集中的某些值或者某些行?


Posted in Python onMay 15, 2019

摘要在进行数据分析与清理中,我们可能常常需要在数据集中去掉某些异常值。具体来说,看看下面的例子。

详解pandas如何去掉、过滤数据集中的某些值或者某些行?

0.导入我们需要使用的包

import pandas as pd

pandas是很常用的数据分析,数据处理的包。anaconda已经有这个包了,纯净版python的可以自行pip安装。

1.去掉某些具体值

数据集df中,对于属性appPlatform(最后一列),我们想删除掉取值为2的那些样本。如何做?非常简单。

import pandas as pd

df[(True-df['appPlatform'].isin([2]))]

详解pandas如何去掉、过滤数据集中的某些值或者某些行?

当然,有时候我们需要去掉不止一个值,这个时候只需要在isin([])的列表中添加。更具体来说,例如,对于appID这个属性,我们想去掉appID=278和appID=382的样本。

df[(True-df['appID'].isin([278,382]))]

详解pandas如何去掉、过滤数据集中的某些值或者某些行?

另外,我们有时候并不只是考虑某一列,还需要考虑另外若干列的情况。例如,我们需要过滤掉appPlatform=2而且appID=278和appID=382的样本呢?非常简单。

df[(True-df['appID'].isin([278,382]))&(True-df['appPlatform'].isin([2]))]

其实,在这里我们看到,就是由两部分组成的,第一部分就是appID中等于278和382的,另外一部分就是appPlatform中等于2的。两者取逻辑关系 与(&)

详解pandas如何去掉、过滤数据集中的某些值或者某些行?

2.过滤掉某个范围的值

上面我们是了解了如何取掉某个具体值,下面,我们要看看如何过滤掉某个范围的值。对于数据集df,我们想过滤掉creativeID(第一列)中ID值大于10000的样本。

df[df['creativeID']<=10000]

详解pandas如何去掉、过滤数据集中的某些值或者某些行?

另外,如果要考虑多列的话,其实和上面一样,将两种情况做逻辑与(&)就可以,不过值得注意的是,每个条件要用括号()括起来。

以上所述是小编给大家介绍的pandas如何去掉、过滤数据集中的某些值或者某些行详解整合,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对三水点靠木网站的支持!

Python 相关文章推荐
python3.3实现乘法表示例
Feb 07 Python
详解Swift中属性的声明与作用
Jun 30 Python
Python编程实现删除VC临时文件及Debug目录的方法
Mar 22 Python
python 容器总结整理
Apr 04 Python
python安装Scrapy图文教程
Aug 14 Python
Django后台获取前端post上传的文件方法
May 28 Python
使用Numpy读取CSV文件,并进行行列删除的操作方法
Jul 04 Python
对Python3 * 和 ** 运算符详解
Feb 16 Python
使用Fabric自动化部署Django项目的实现
Sep 27 Python
详解Python绘图Turtle库
Oct 12 Python
python多线程高级锁condition简单用法示例
Nov 07 Python
python可视化分析绘制带趋势线的散点图和边缘直方图
Jun 25 Python
详解Python列表赋值复制深拷贝及5种浅拷贝
May 15 #Python
Python 20行简单实现有道在线翻译的详解
May 15 #Python
Python中的字符串切片(截取字符串)的详解
May 15 #Python
python3 property装饰器实现原理与用法示例
May 15 #Python
详解Python下载图片并保存本地的两种方式
May 15 #Python
Python常用模块之requests模块用法分析
May 15 #Python
Django框架实现的普通登录案例【使用POST方法】
May 15 #Python
You might like
PHP实现多服务器session共享之NFS共享的方法
2007/03/16 PHP
PHP表单验证的3个函数ISSET()、empty()、is_numeric()的使用方法
2011/08/22 PHP
PHP获取文件后缀名的三个函数
2012/10/15 PHP
php 判断服务器操作系统的类型
2014/02/17 PHP
PHPMailer发送HTML内容、带附件的邮件实例
2014/07/01 PHP
PHP绕过open_basedir限制操作文件的方法
2018/06/10 PHP
用javascript实现自定义标签
2007/05/08 Javascript
javascript对象之内置对象Math使用方法
2010/04/16 Javascript
jquery 圆形旋转图片滚动切换效果
2011/01/19 Javascript
jquery中ajax学习笔记4
2011/10/16 Javascript
php对mongodb的扩展(小试牛刀)
2012/11/11 Javascript
js模拟C#中List的简单实例
2014/03/06 Javascript
浅谈javascript的调试
2015/01/28 Javascript
js网页滚动条滚动事件实例分析
2015/05/05 Javascript
JS或jQuery获取ASP.NET服务器控件ID的方法
2015/06/08 Javascript
Bootstrap表单布局样式源代码
2016/07/04 Javascript
jquery层级选择器(匹配父元素下的子元素实现代码)
2016/09/05 Javascript
JS自定义函数对web前端上传的文件进行类型大小判断
2016/10/19 Javascript
利用python分析access日志的方法
2016/10/26 Javascript
详解vue-Resource(与后端数据交互)
2017/01/16 Javascript
详解windows下vue-cli及webpack 构建网站(二)导入bootstrap样式
2017/06/17 Javascript
nodejs初始化init的示例代码
2018/10/10 NodeJs
vue路由守卫及路由守卫无限循环问题详析
2019/09/05 Javascript
vue实现pdf文档在线预览功能
2019/11/26 Javascript
[03:20]次级联赛厮杀超职业 现超级兵对拆世纪大战
2014/10/30 DOTA
Python中返回字典键的值的values()方法使用
2015/05/22 Python
Python数据分析库pandas基本操作方法
2018/04/08 Python
从DataFrame中提取出Series或DataFrame对象的方法
2018/11/10 Python
浅谈pyqt5中信号与槽的认识
2019/02/17 Python
opencv python在视屏上截图功能的实现
2020/03/05 Python
Windows下Anaconda安装、换源与更新的方法
2020/04/17 Python
详解python with 上下文管理器
2020/09/02 Python
环保宣传标语
2014/06/12 职场文书
领导干部作风建设剖析材料
2014/10/11 职场文书
2015年护士工作总结范文
2015/03/31 职场文书
基于Python绘制子图及子图刻度的变换等的问题
2021/05/23 Python