Pandas||过滤缺失数据||pd.dropna()函数的用法说明


Posted in Python onMay 14, 2021

看代码吧~

DataFrame.dropna(axis=0, how='any', thresh=None, subset=None, inplace=False)
Remove missing values.

pd.dropna()函数(官方文档)用于过滤数据中的缺失数据.

缺失数据在pandas中用NaN标记.

import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.randn(5, 3), index = list('abcde'), columns = ['one', 'two', 'three'])        # 随机产生5行3列的数据    
df.ix[1, :-1] = np.nan        # 将指定数据定义为缺失
df.ix[1:-1, 2] = np.nan
print(df)

Pandas||过滤缺失数据||pd.dropna()函数的用法说明

df.dropna()   #删除所有带缺失数据的行

Pandas||过滤缺失数据||pd.dropna()函数的用法说明

parameters 详解
axis default 0指行,1为列
how {‘any', ‘all'}, default ‘any'指带缺失值的所有行;'all'指清除全是缺失值的行
thresh int,保留含有int个非空值的行
subset 对特定的列进行缺失值删除处理
inplace 这个很常见,True表示就地更改

补充:Python-pandas的dropna()方法-丢弃含空值的行、列

0.摘要

dropna()方法,能够找到DataFrame类型数据的空值(缺失值),将空值所在的行/列删除后,将新的DataFrame作为返回值返回。

1.函数详解

函数形式:dropna(axis=0, how='any', thresh=None, subset=None, inplace=False)

参数:

axis:轴。0或'index',表示按行删除;1或'columns',表示按列删除。

how:筛选方式。‘any',表示该行/列只要有一个以上的空值,就删除该行/列;‘all',表示该行/列全部都为空值,就删除该行/列。

thresh:非空元素最低数量。int型,默认为None。如果该行/列中,非空元素数量小于这个值,就删除该行/列。

subset:子集。列表,元素为行或者列的索引。如果axis=0或者‘index',subset中元素为列的索引;如果axis=1或者‘column',subset中元素为行的索引。由subset限制的子区域,是判断是否删除该行/列的条件判断区域。

inplace:是否原地替换。布尔值,默认为False。如果为True,则在原DataFrame上进行操作,返回值为None。

2.示例

创建DataFrame数据:

import numpy as np
import pandas as pd
 
a = np.ones((11,10))
for i in range(len(a)):
    a[i,:i] = np.nan
 
d = pd.DataFrame(data=a)
print(d)

Pandas||过滤缺失数据||pd.dropna()函数的用法说明

按行删除:存在空值,即删除该行

# 按行删除:存在空值,即删除该行
print(d.dropna(axis=0, how='any'))

Pandas||过滤缺失数据||pd.dropna()函数的用法说明

按行删除:所有数据都为空值,即删除该行

#  按行删除:所有数据都为空值,即删除该行
print(d.dropna(axis=0, how='all'))

Pandas||过滤缺失数据||pd.dropna()函数的用法说明

按列删除:该列非空元素小于5个的,即删除该列

# 按列删除:该列非空元素小于5个的,即删除该列
print(d.dropna(axis='columns', thresh=5))

Pandas||过滤缺失数据||pd.dropna()函数的用法说明

设置子集:删除第0、5、6、7列都为空的行

# 设置子集:删除第0、5、6、7列都为空的行
print(d.dropna(axis='index', how='all', subset=[0,5,6,7]))

Pandas||过滤缺失数据||pd.dropna()函数的用法说明

设置子集:删除第5、6、7行存在空值的列

# 设置子集:删除第5、6、7行存在空值的列
print(d.dropna(axis=1, how='any', subset=[5,6,7]))

Pandas||过滤缺失数据||pd.dropna()函数的用法说明

原地修改

# 原地修改
print(d.dropna(axis=0, how='any', inplace=True))
print("==============================")
print(d)

Pandas||过滤缺失数据||pd.dropna()函数的用法说明

以上为个人经验,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python中使用urllib2获取http请求状态码的代码例子
Jul 07 Python
黑科技 Python脚本帮你找出微信上删除你好友的人
Jan 07 Python
通过Python使用saltstack生成服务器资产清单
Mar 01 Python
Python Paramiko模块的使用实际案例
Feb 01 Python
使用python写的opencv实时监测和解析二维码和条形码
Aug 14 Python
Pytorch之卷积层的使用详解
Dec 31 Python
parser.add_argument中的action使用
Apr 20 Python
详解Django配置JWT认证方式
May 09 Python
Python unittest discover批量执行代码实例
Sep 08 Python
详解如何修改python中字典的键和值
Sep 29 Python
Python连续赋值需要注意的一些问题
Jun 03 Python
Python数据结构之队列详解
Mar 21 Python
Python爬虫:从m3u8文件里提取小视频的正确操作
MATLAB 全景图切割及盒图显示的实现步骤
使用pandas或numpy处理数据中的空值(np.isnan()/pd.isnull())
May 14 #Python
PyQt5爬取12306车票信息程序的实现
python flask框架快速入门
如何将numpy二维数组中的np.nan值替换为指定的值
May 14 #Python
使用numpy nonzero 找出非0元素
May 14 #Python
You might like
PHP之生成GIF动画的实现方法
2013/06/07 PHP
PHP实现Javascript中的escape及unescape函数代码分享
2015/02/10 PHP
PHP浮点数的一个常见问题
2016/03/10 PHP
javascript xml为数据源的下拉框控件
2009/07/07 Javascript
JQuery 选择器、过滤器介绍
2011/02/14 Javascript
一个JQuery写的点击上下滚动的小例子
2011/08/27 Javascript
JS 如何获取radio选中后的值及不选择取radio的值
2013/10/28 Javascript
JavaScript获取网页、浏览器、屏幕高度和宽度汇总
2014/12/18 Javascript
Javascript代码实现仿实例化类
2015/04/03 Javascript
JavaScript实现点击按钮复制指定区域文本(推荐)
2016/11/25 Javascript
javascript按钮禁用和启用的效果实例代码
2017/10/29 Javascript
JS中Object对象的原型概念基础
2018/01/29 Javascript
JavaScript执行环境及作用域链实例分析
2018/08/01 Javascript
Vue vm.$attrs使用场景详解
2020/03/08 Javascript
解决React在安装antd之后出现的Can't resolve './locale'问题(推荐)
2020/05/03 Javascript
微信小程序视频弹幕发送功能的实现
2020/12/28 Javascript
[05:15]DOTA2英雄梦之声_第16期_灰烬之灵
2014/06/21 DOTA
使用Python的Flask框架构建大型Web应用程序的结构示例
2016/06/04 Python
利用Python抓取行政区划码的方法
2016/11/28 Python
Python实现的文本简单可逆加密算法示例
2017/05/18 Python
python实现图片批量压缩程序
2018/07/23 Python
Python从Excel中读取日期一列的方法
2018/11/28 Python
Django对数据库进行添加与更新的例子
2019/07/12 Python
python tkinter图形界面代码统计工具(更新)
2019/09/18 Python
pytorch使用 to 进行类型转换方式
2020/01/08 Python
解决python cv2.imread 读取中文路径的图片返回为None的问题
2020/06/02 Python
如何卸载python插件
2020/07/08 Python
python的scipy.stats模块中正态分布常用函数总结
2021/02/19 Python
为奢侈时尚带来了慈善元素:Olivela
2018/09/29 全球购物
乳制品整治工作方案
2014/05/29 职场文书
争先创优心得体会
2014/09/12 职场文书
四风问题个人剖析材料
2014/10/07 职场文书
作弊检讨书
2015/01/27 职场文书
保研推荐信格式
2015/03/25 职场文书
关于环保的广播稿
2015/12/17 职场文书
2016应届毕业生就业指导课心得体会
2016/01/15 职场文书