详解pandas如何去掉、过滤数据集中的某些值或者某些行?


Posted in Python onMay 15, 2019

摘要在进行数据分析与清理中,我们可能常常需要在数据集中去掉某些异常值。具体来说,看看下面的例子。

详解pandas如何去掉、过滤数据集中的某些值或者某些行?

0.导入我们需要使用的包

import pandas as pd

pandas是很常用的数据分析,数据处理的包。anaconda已经有这个包了,纯净版python的可以自行pip安装。

1.去掉某些具体值

数据集df中,对于属性appPlatform(最后一列),我们想删除掉取值为2的那些样本。如何做?非常简单。

import pandas as pd

df[(True-df['appPlatform'].isin([2]))]

详解pandas如何去掉、过滤数据集中的某些值或者某些行?

当然,有时候我们需要去掉不止一个值,这个时候只需要在isin([])的列表中添加。更具体来说,例如,对于appID这个属性,我们想去掉appID=278和appID=382的样本。

df[(True-df['appID'].isin([278,382]))]

详解pandas如何去掉、过滤数据集中的某些值或者某些行?

另外,我们有时候并不只是考虑某一列,还需要考虑另外若干列的情况。例如,我们需要过滤掉appPlatform=2而且appID=278和appID=382的样本呢?非常简单。

df[(True-df['appID'].isin([278,382]))&(True-df['appPlatform'].isin([2]))]

其实,在这里我们看到,就是由两部分组成的,第一部分就是appID中等于278和382的,另外一部分就是appPlatform中等于2的。两者取逻辑关系 与(&)

详解pandas如何去掉、过滤数据集中的某些值或者某些行?

2.过滤掉某个范围的值

上面我们是了解了如何取掉某个具体值,下面,我们要看看如何过滤掉某个范围的值。对于数据集df,我们想过滤掉creativeID(第一列)中ID值大于10000的样本。

df[df['creativeID']<=10000]

详解pandas如何去掉、过滤数据集中的某些值或者某些行?

另外,如果要考虑多列的话,其实和上面一样,将两种情况做逻辑与(&)就可以,不过值得注意的是,每个条件要用括号()括起来。

以上所述是小编给大家介绍的pandas如何去掉、过滤数据集中的某些值或者某些行详解整合,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对三水点靠木网站的支持!

Python 相关文章推荐
Python实现Tab自动补全和历史命令管理的方法
Mar 12 Python
在Python中用split()方法分割字符串的使用介绍
May 20 Python
简单实现python收发邮件功能
Jan 05 Python
python实现图片筛选程序
Oct 24 Python
删除DataFrame中值全为NaN或者包含有NaN的列或行方法
Nov 06 Python
python pytest进阶之xunit fixture详解
Jun 27 Python
详解Python3 pickle模块用法
Sep 16 Python
django 链接多个数据库 并使用原生sql实现
Mar 28 Python
Python 执行矩阵与线性代数运算
Aug 01 Python
使用django自带的user做外键的方法
Nov 30 Python
python读取pdf格式文档的实现代码
Apr 01 Python
利用Matlab绘制各类特殊图形的实例代码
Jul 16 Python
详解Python列表赋值复制深拷贝及5种浅拷贝
May 15 #Python
Python 20行简单实现有道在线翻译的详解
May 15 #Python
Python中的字符串切片(截取字符串)的详解
May 15 #Python
python3 property装饰器实现原理与用法示例
May 15 #Python
详解Python下载图片并保存本地的两种方式
May 15 #Python
Python常用模块之requests模块用法分析
May 15 #Python
Django框架实现的普通登录案例【使用POST方法】
May 15 #Python
You might like
桌面中心(三)修改数据库
2006/10/09 PHP
PHP中的switch语句的用法实例详解
2015/10/21 PHP
使用PHP如何实现高效安全的ftp服务器(二)
2015/12/30 PHP
php通过smtp邮件验证登陆的方法
2016/05/11 PHP
详解php反序列化
2020/06/10 PHP
js设置组合快捷键/tabindex功能的方法
2013/11/21 Javascript
javascript遍历控件实例详细解析
2014/01/10 Javascript
js完美的div拖拽实例代码
2014/01/22 Javascript
jQuery内置的AJAX功能和JSON的使用实例
2014/07/27 Javascript
jQuery UI插件自定义confirm确认框的方法
2015/03/20 Javascript
JavaScript判断IE版本型号
2015/07/27 Javascript
jquery实现动画菜单的左右滚动、渐变及图形背景滚动等效果
2015/08/25 Javascript
confirm确认对话框的实现方法总结
2016/06/17 Javascript
解决Window10系统下Node安装报错的问题分析
2016/12/13 Javascript
Bootstrap php制作动态分页标签
2016/12/23 Javascript
微信小程序实现文字无限轮播效果
2018/12/28 Javascript
ES6知识点整理之函数对象参数默认值及其解构应用示例
2019/04/17 Javascript
详解Vue项目引入CreateJS的方法(亲测可用)
2019/05/30 Javascript
python 切片和range()用法说明
2013/03/24 Python
使用Python抓取模板之家的CSS模板
2015/03/16 Python
Python实现随机生成有效手机号码及身份证功能示例
2017/06/05 Python
一个Python最简单的接口自动化框架
2018/01/02 Python
Python Xml文件添加字节属性的方法
2018/03/31 Python
python+numpy实现的基本矩阵操作示例
2019/07/19 Python
Python3 pandas 操作列表实例详解
2019/09/23 Python
Python实现代码块儿折叠
2020/04/15 Python
使用iframe+postMessage实现页面跨域通信的示例代码
2020/01/14 HTML / CSS
英国最大的宝石首饰超市:QP Jewellers
2018/09/23 全球购物
介绍下Java中==和equals的区别
2013/09/01 面试题
策划主管的工作职责
2013/11/24 职场文书
会计电算化专业毕业生自荐信
2013/12/20 职场文书
商铺门面租房协议书
2014/10/21 职场文书
2016大学自主招生推荐信范文
2015/03/23 职场文书
一个独生女的故事观后感
2015/06/04 职场文书
2016年“我们的节日·清明节”活动总结
2016/04/01 职场文书
CSS实现隐藏搜索框功能(动画正反向序列)
2021/07/21 HTML / CSS