详解pandas如何去掉、过滤数据集中的某些值或者某些行?


Posted in Python onMay 15, 2019

摘要在进行数据分析与清理中,我们可能常常需要在数据集中去掉某些异常值。具体来说,看看下面的例子。

详解pandas如何去掉、过滤数据集中的某些值或者某些行?

0.导入我们需要使用的包

import pandas as pd

pandas是很常用的数据分析,数据处理的包。anaconda已经有这个包了,纯净版python的可以自行pip安装。

1.去掉某些具体值

数据集df中,对于属性appPlatform(最后一列),我们想删除掉取值为2的那些样本。如何做?非常简单。

import pandas as pd

df[(True-df['appPlatform'].isin([2]))]

详解pandas如何去掉、过滤数据集中的某些值或者某些行?

当然,有时候我们需要去掉不止一个值,这个时候只需要在isin([])的列表中添加。更具体来说,例如,对于appID这个属性,我们想去掉appID=278和appID=382的样本。

df[(True-df['appID'].isin([278,382]))]

详解pandas如何去掉、过滤数据集中的某些值或者某些行?

另外,我们有时候并不只是考虑某一列,还需要考虑另外若干列的情况。例如,我们需要过滤掉appPlatform=2而且appID=278和appID=382的样本呢?非常简单。

df[(True-df['appID'].isin([278,382]))&(True-df['appPlatform'].isin([2]))]

其实,在这里我们看到,就是由两部分组成的,第一部分就是appID中等于278和382的,另外一部分就是appPlatform中等于2的。两者取逻辑关系 与(&)

详解pandas如何去掉、过滤数据集中的某些值或者某些行?

2.过滤掉某个范围的值

上面我们是了解了如何取掉某个具体值,下面,我们要看看如何过滤掉某个范围的值。对于数据集df,我们想过滤掉creativeID(第一列)中ID值大于10000的样本。

df[df['creativeID']<=10000]

详解pandas如何去掉、过滤数据集中的某些值或者某些行?

另外,如果要考虑多列的话,其实和上面一样,将两种情况做逻辑与(&)就可以,不过值得注意的是,每个条件要用括号()括起来。

以上所述是小编给大家介绍的pandas如何去掉、过滤数据集中的某些值或者某些行详解整合,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对三水点靠木网站的支持!

Python 相关文章推荐
Python进行数据科学工作的简单入门教程
Apr 01 Python
Python字符串格式化
Jun 15 Python
python中闭包Closure函数作为返回值的方法示例
Dec 17 Python
numpy.random.seed()的使用实例解析
Feb 03 Python
使用 Python 实现文件递归遍历的三种方式
Jul 18 Python
Python Pandas 获取列匹配特定值的行的索引问题
Jul 01 Python
使用Python轻松完成垃圾分类(基于图像识别)
Jul 09 Python
django创建最简单HTML页面跳转方法
Aug 16 Python
python 数据提取及拆分的实现代码
Aug 26 Python
Pycharm创建项目时如何自动添加头部信息
Nov 14 Python
Python实现Canny及Hough算法代码实例解析
Aug 06 Python
解决Python import .pyd 可能遇到路径的问题
Mar 04 Python
详解Python列表赋值复制深拷贝及5种浅拷贝
May 15 #Python
Python 20行简单实现有道在线翻译的详解
May 15 #Python
Python中的字符串切片(截取字符串)的详解
May 15 #Python
python3 property装饰器实现原理与用法示例
May 15 #Python
详解Python下载图片并保存本地的两种方式
May 15 #Python
Python常用模块之requests模块用法分析
May 15 #Python
Django框架实现的普通登录案例【使用POST方法】
May 15 #Python
You might like
第1次亲密接触PHP5(2)
2006/10/09 PHP
深入理解PHP之源码目录结构与功能说明
2016/06/01 PHP
php 5.4 全新的代码复用Trait详解
2017/01/05 PHP
laravel 框架配置404等异常页面
2019/01/07 PHP
File文件控件,选中文件(图片,flash,视频)即立即预览显示
2009/04/09 Javascript
ExtJS4 Grid改变单元格背景颜色及Column render学习
2013/02/06 Javascript
关于JS数组追加数组采用push.apply的问题
2014/06/09 Javascript
javascript实现回到顶部特效
2015/05/06 Javascript
JS基于面向对象实现的放烟花效果
2015/05/07 Javascript
JavaScript合并两个数组并去除重复项的方法
2015/06/13 Javascript
jquery选择器简述
2015/08/31 Javascript
JS实现超简单的鼠标拖动效果
2015/11/02 Javascript
浅析Nodejs npm常用命令
2016/06/14 NodeJs
Javascript中从学习bind到实现bind的过程
2018/01/05 Javascript
点击按钮弹出模态框的一系列操作代码实例
2019/03/29 Javascript
vue实现pdf文档在线预览功能
2019/11/26 Javascript
微信小程序vant弹窗组件的实现方式
2020/02/21 Javascript
JS自定义右键菜单实现代码解析
2020/07/16 Javascript
详解vue实现坐标拾取器功能示例
2020/11/18 Vue.js
[01:57]2016完美“圣”典风云人物:国士无双专访
2016/12/04 DOTA
Python爬取网页中的图片(搜狗图片)详解
2017/03/23 Python
老生常谈Python序列化和反序列化
2017/06/28 Python
Python中psutil的介绍与用法
2019/05/02 Python
Django项目中实现使用qq第三方登录功能
2019/08/13 Python
HTML5的结构和语义(5):交互
2008/10/17 HTML / CSS
Amara美国站:英国高端家居礼品网站,世界各地的奢侈家具品牌
2017/07/26 全球购物
可打印的优惠券、杂货和优惠券代码:Coupons.com
2018/06/12 全球购物
世界上最大的高分辨率在线图片库:Alamy
2018/07/07 全球购物
澳大利亚二手奢侈品网站:Modsie
2019/09/23 全球购物
兰蔻俄罗斯官方网站:Lancome俄罗斯
2019/12/09 全球购物
餐饮业会计岗位职责
2013/12/19 职场文书
人事专员的岗位职责
2014/03/01 职场文书
普通话宣传标语
2014/06/26 职场文书
莫言获奖感言(全文)
2015/07/31 职场文书
2019感恩宣传标语!
2019/07/05 职场文书
Go中使用gjson来操作JSON数据的实现
2022/08/14 Golang