详解pandas如何去掉、过滤数据集中的某些值或者某些行?


Posted in Python onMay 15, 2019

摘要在进行数据分析与清理中,我们可能常常需要在数据集中去掉某些异常值。具体来说,看看下面的例子。

详解pandas如何去掉、过滤数据集中的某些值或者某些行?

0.导入我们需要使用的包

import pandas as pd

pandas是很常用的数据分析,数据处理的包。anaconda已经有这个包了,纯净版python的可以自行pip安装。

1.去掉某些具体值

数据集df中,对于属性appPlatform(最后一列),我们想删除掉取值为2的那些样本。如何做?非常简单。

import pandas as pd

df[(True-df['appPlatform'].isin([2]))]

详解pandas如何去掉、过滤数据集中的某些值或者某些行?

当然,有时候我们需要去掉不止一个值,这个时候只需要在isin([])的列表中添加。更具体来说,例如,对于appID这个属性,我们想去掉appID=278和appID=382的样本。

df[(True-df['appID'].isin([278,382]))]

详解pandas如何去掉、过滤数据集中的某些值或者某些行?

另外,我们有时候并不只是考虑某一列,还需要考虑另外若干列的情况。例如,我们需要过滤掉appPlatform=2而且appID=278和appID=382的样本呢?非常简单。

df[(True-df['appID'].isin([278,382]))&(True-df['appPlatform'].isin([2]))]

其实,在这里我们看到,就是由两部分组成的,第一部分就是appID中等于278和382的,另外一部分就是appPlatform中等于2的。两者取逻辑关系 与(&)

详解pandas如何去掉、过滤数据集中的某些值或者某些行?

2.过滤掉某个范围的值

上面我们是了解了如何取掉某个具体值,下面,我们要看看如何过滤掉某个范围的值。对于数据集df,我们想过滤掉creativeID(第一列)中ID值大于10000的样本。

df[df['creativeID']<=10000]

详解pandas如何去掉、过滤数据集中的某些值或者某些行?

另外,如果要考虑多列的话,其实和上面一样,将两种情况做逻辑与(&)就可以,不过值得注意的是,每个条件要用括号()括起来。

以上所述是小编给大家介绍的pandas如何去掉、过滤数据集中的某些值或者某些行详解整合,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对三水点靠木网站的支持!

Python 相关文章推荐
python中使用百度音乐搜索的api下载指定歌曲的lrc歌词
Jul 18 Python
几个提升Python运行效率的方法之间的对比
Apr 03 Python
在Django的视图中使用form对象的方法
Jul 18 Python
Python中的多行注释文档编写风格汇总
Jun 16 Python
python paramiko模块学习分享
Aug 23 Python
Python 分享10个PyCharm技巧
Jul 13 Python
Python SQLAlchemy入门教程(基本用法)
Nov 11 Python
Python利用逻辑回归模型解决MNIST手写数字识别问题详解
Jan 14 Python
python 解决tqdm模块不能单行显示的问题
Feb 19 Python
python合并多个excel文件的示例
Sep 23 Python
python中二分查找法的实现方法
Dec 06 Python
基于Python编写简易版的天天跑酷游戏的示例代码
Mar 23 Python
详解Python列表赋值复制深拷贝及5种浅拷贝
May 15 #Python
Python 20行简单实现有道在线翻译的详解
May 15 #Python
Python中的字符串切片(截取字符串)的详解
May 15 #Python
python3 property装饰器实现原理与用法示例
May 15 #Python
详解Python下载图片并保存本地的两种方式
May 15 #Python
Python常用模块之requests模块用法分析
May 15 #Python
Django框架实现的普通登录案例【使用POST方法】
May 15 #Python
You might like
PHP概述.
2006/10/09 PHP
PHP随机字符串生成代码(包括大小写字母)
2013/06/24 PHP
PHP面试题之文件目录操作
2015/10/15 PHP
PHP下使用mysqli的函数连接mysql出现warning: mysqli::real_connect(): (hy000/1040): ...
2016/02/14 PHP
thinkPHP模板中for循环与switch语句用法示例
2016/11/30 PHP
PHP实现非阻塞模式的方法分析
2018/07/26 PHP
JS中Date日期函数中的参数使用介绍
2014/01/02 Javascript
js控制页面的全屏展示和退出全屏显示的方法
2015/03/10 Javascript
简易的JS计算器实现代码
2016/10/18 Javascript
AngularJS 防止页面闪烁的方法
2017/03/09 Javascript
vue使用axios实现文件上传进度的实时更新详解
2017/12/20 Javascript
详解Vue.js自定义tipOnce指令用法实例
2018/12/19 Javascript
微信小程序从注册账号到上架(图文详解)
2019/07/17 Javascript
javascript 高级语法之继承的基本使用方法示例
2019/11/11 Javascript
JS数组方法concat()用法实例分析
2020/01/18 Javascript
详解JavaScript之ES5的继承
2020/07/08 Javascript
Vue3不支持Filters过滤器的问题
2020/09/24 Javascript
python生成IP段的方法
2015/07/07 Python
实例讲解Python设计模式编程之工厂方法模式的使用
2016/03/02 Python
python 捕获 shell/bash 脚本的输出结果实例
2017/01/04 Python
python用pandas数据加载、存储与文件格式的实例
2018/12/07 Python
python启动应用程序和终止应用程序的方法
2019/06/28 Python
完美解决python3.7 pip升级 拒绝访问问题
2019/07/12 Python
关于python3.9安装wordcloud出错的问题及解决办法
2020/11/02 Python
露营世界:Camping World
2017/02/02 全球购物
SmartBuyGlasses中国:唯视良品(销售名牌太阳镜、墨镜和眼镜框)
2017/07/03 全球购物
德国购买门票网站:ADticket.de
2019/10/31 全球购物
美国眼镜网站:LensCrafters
2020/01/19 全球购物
运动会广播稿50字
2014/01/26 职场文书
生日宴会策划方案
2014/06/03 职场文书
幼儿教师暑期培训方案
2014/08/27 职场文书
2015年保洁员工作总结
2015/05/04 职场文书
红色经典观后感
2015/06/18 职场文书
高中班主任培训心得体会
2016/01/07 职场文书
关于golang高并发的实现与注意事项说明
2021/05/08 Golang
JavaScript 数组去重详解
2021/09/15 Javascript