详解pandas如何去掉、过滤数据集中的某些值或者某些行?


Posted in Python onMay 15, 2019

摘要在进行数据分析与清理中,我们可能常常需要在数据集中去掉某些异常值。具体来说,看看下面的例子。

详解pandas如何去掉、过滤数据集中的某些值或者某些行?

0.导入我们需要使用的包

import pandas as pd

pandas是很常用的数据分析,数据处理的包。anaconda已经有这个包了,纯净版python的可以自行pip安装。

1.去掉某些具体值

数据集df中,对于属性appPlatform(最后一列),我们想删除掉取值为2的那些样本。如何做?非常简单。

import pandas as pd

df[(True-df['appPlatform'].isin([2]))]

详解pandas如何去掉、过滤数据集中的某些值或者某些行?

当然,有时候我们需要去掉不止一个值,这个时候只需要在isin([])的列表中添加。更具体来说,例如,对于appID这个属性,我们想去掉appID=278和appID=382的样本。

df[(True-df['appID'].isin([278,382]))]

详解pandas如何去掉、过滤数据集中的某些值或者某些行?

另外,我们有时候并不只是考虑某一列,还需要考虑另外若干列的情况。例如,我们需要过滤掉appPlatform=2而且appID=278和appID=382的样本呢?非常简单。

df[(True-df['appID'].isin([278,382]))&(True-df['appPlatform'].isin([2]))]

其实,在这里我们看到,就是由两部分组成的,第一部分就是appID中等于278和382的,另外一部分就是appPlatform中等于2的。两者取逻辑关系 与(&)

详解pandas如何去掉、过滤数据集中的某些值或者某些行?

2.过滤掉某个范围的值

上面我们是了解了如何取掉某个具体值,下面,我们要看看如何过滤掉某个范围的值。对于数据集df,我们想过滤掉creativeID(第一列)中ID值大于10000的样本。

df[df['creativeID']<=10000]

详解pandas如何去掉、过滤数据集中的某些值或者某些行?

另外,如果要考虑多列的话,其实和上面一样,将两种情况做逻辑与(&)就可以,不过值得注意的是,每个条件要用括号()括起来。

以上所述是小编给大家介绍的pandas如何去掉、过滤数据集中的某些值或者某些行详解整合,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对三水点靠木网站的支持!

Python 相关文章推荐
Python 匹配任意字符(包括换行符)的正则表达式写法
Oct 29 Python
python实现的一只从百度开始不断搜索的小爬虫
Aug 13 Python
Python高级应用实例对比:高效计算大文件中的最长行的长度
Jun 08 Python
使用grappelli为django admin后台添加模板
Nov 18 Python
简单理解Python中的装饰器
Jul 31 Python
django1.8使用表单上传文件的实现方法
Nov 04 Python
python TCP Socket的粘包和分包的处理详解
Feb 09 Python
python实现扫描日志关键字的示例
Apr 28 Python
详解python3安装pillow后报错没有pillow模块以及没有PIL模块问题解决
Apr 17 Python
Python 通过爬虫实现GitHub网页的模拟登录的示例代码
Aug 17 Python
一些关于python 装饰器的个人理解
Aug 31 Python
python自动从arxiv下载paper的示例代码
Dec 05 Python
详解Python列表赋值复制深拷贝及5种浅拷贝
May 15 #Python
Python 20行简单实现有道在线翻译的详解
May 15 #Python
Python中的字符串切片(截取字符串)的详解
May 15 #Python
python3 property装饰器实现原理与用法示例
May 15 #Python
详解Python下载图片并保存本地的两种方式
May 15 #Python
Python常用模块之requests模块用法分析
May 15 #Python
Django框架实现的普通登录案例【使用POST方法】
May 15 #Python
You might like
php加密解密函数authcode的用法详细解析
2013/10/28 PHP
php配置php-fpm启动参数及配置详解
2013/11/04 PHP
PHP中多维数组的foreach遍历示例
2014/06/13 PHP
Yii的CDbCriteria查询条件用法实例
2014/12/04 PHP
驱动事件的addEvent.js代码
2007/03/27 Javascript
JavaScript面向对象知识串结(读JavaScript高级程序设计(第三版))
2012/07/17 Javascript
jQuery实现鼠标可拖动调整表格列宽度
2014/05/26 Javascript
angularJS结合canvas画图例子
2015/02/09 Javascript
js自定义回调函数
2015/12/13 Javascript
JavaScript实现相册弹窗功能(zepto.js)
2016/06/21 Javascript
基于BootStrap环境写jQuery tabs插件
2016/07/12 Javascript
深入浅析javascript中的作用域(推荐)
2016/07/19 Javascript
有关文件上传 非ajax提交 得到后台数据问题
2016/10/12 Javascript
Javascript实现倒计时(防页面刷新)实例
2016/12/13 Javascript
Vue.js展示AJAX数据简单示例讲解
2017/03/29 Javascript
详解vue嵌套路由-query传递参数
2017/05/23 Javascript
在layui中使用form表单监听ajax异步验证注册的实例
2019/09/03 Javascript
vue实现购物车结算功能
2020/06/18 Javascript
原生JS实现微信通讯录
2020/06/18 Javascript
Vue.js中Line第三方登录api的实现代码
2020/06/29 Javascript
Python设计模式编程中Adapter适配器模式的使用实例
2016/03/02 Python
使用Python的Django和layim实现即时通讯的方法
2018/05/25 Python
Tensorflow 训练自己的数据集将数据直接导入到内存
2018/06/19 Python
python实现自动登录
2018/09/17 Python
Pycharm新手教程(只需要看这篇就够了)
2019/06/18 Python
python 画二维、三维点之间的线段实现方法
2019/07/07 Python
Python笔记之工厂模式
2019/11/20 Python
PyTorch中topk函数的用法详解
2020/01/02 Python
Pandas中DataFrame基本函数整理(小结)
2020/07/20 Python
HTML5 canvas基本绘图之绘制线条
2016/06/27 HTML / CSS
AmazeUI底部导航栏与分享按钮的示例代码
2020/08/18 HTML / CSS
印度购买眼镜和太阳镜网站:Coolwinks
2018/09/26 全球购物
Expedia法国:全球最大在线旅游公司
2018/09/30 全球购物
竞争上岗演讲稿
2014/01/05 职场文书
机关领导干部作风整顿整改措施
2014/09/19 职场文书
年度考核表个人总结
2015/03/06 职场文书