python缺失值填充方法示例代码


Posted in Python onDecember 24, 2022

1.找到缺失值

导入数据集

df=pd.read_csv("nba.csv")
df.head(10)

替换异常值(数据集中异常值为“-”)

把数据集中的异常值用“NaN”替换

# 将空值形式的缺失值转换成可识别的类型
data = data.replace('-', np.NaN)

2.计算缺失值的数量

用# isnull() 函数,确认各列是否有缺失值1.

null_all = df.isnull().sum()
print(null_all)

python缺失值填充方法示例代码

.sum();表示可以显示各个列的缺失值数量。

null_all = df.isnull.any(axis=1)#表示那些行具有缺失值,

.any()表示只要按行或列计算,有缺失值就算入
.all()表示所在行或列全为缺失值才计入
.sum()表示计算列缺失值时,一列有多个缺失值,同理,计算行缺失,计算有多少个行

3.处理缺失值

3.1:df.dropna():直接删除行列

df表示数据集的名称

  • dropna(axis=0, how=‘any’, thresh=None, subset=None, inplace=False)

括号内上述参数都是函数默认。

axis=0:表示对行进行删除操作,axis=1:对列删除进行操作
how=‘any’:表示维度 存在“缺失值”就删除相应行/列操作;how=‘all’:进行相关行或列删除操作时,只有所有维度缺失才删除
thresh=None:等于几表示有几个缺失值存在才会删除所在的行或列。
inplace=False:表示对原来的数据集不进行操作,True时表示对原来的数据集也进行操作。

3.2:df.fillna()填充缺失值

  • fillna(value=None, method=None, axis=None, inplace=False, limit=None, downcast=None)

axis : {0 or ‘index’, 1 or ‘columns’}

method : {‘backfill’, ‘bfill’, ‘pad’, ‘ffill’, None}
pad’, ‘ffill:将前面的值填充于后面位置。
backfill’, 'bfill:表示将后面的值填充于前面位置。

data.fillna(data.mean())#平均值填充
data.fillna(data.median())#中位数填充

3.3:KNN填充

from sklearn.impute import KNNImputer
imputer = KNNImputer(n_neighbors=4)#邻居样本求平均数
df1=imputer.fit_transform(df)

4.查看数据集的末尾

df.tail(10)

查看末尾10行

总结

到此这篇关于python缺失值填充方法的文章就介绍到这了,更多相关python缺失值填充方法内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
Windows和Linux下使用Python访问SqlServer的方法介绍
Mar 10 Python
python自定义解析简单xml格式文件的方法
May 11 Python
Python中使用多进程来实现并行处理的方法小结
Aug 09 Python
小米5s微信跳一跳小程序python源码
Jan 08 Python
win7下python3.6安装配置方法图文教程
Jul 31 Python
详解python Todo清单实战
Nov 01 Python
浅析Python 实现一个自动化翻译和替换的工具
Apr 14 Python
Python Flask上下文管理机制实例解析
Mar 16 Python
Python爬虫工具requests-html使用解析
Apr 29 Python
利用python控制Autocad:pyautocad方式
Jun 01 Python
基于SQLAlchemy实现操作MySQL并执行原生sql语句
Jun 10 Python
MATLAB 如何求取离散点的曲率最大值
Apr 16 Python
Python  序列化反序列化和异常处理的问题小结
Dec 24 #Python
Python find()、rfind()方法及作用
Dec 24 #Python
Python使用pandas导入xlsx格式的excel文件内容操作代码
Dec 24 #Python
Python 第三方库 openpyxl 的安装过程
Dec 24 #Python
python index() 与 rindex() 方法的使用示例详解
Dec 24 #Python
python+pyhyper实现识别图片中的车牌号思路详解
Dec 24 #Python
python pandas 解析(读取、写入)CSV 文件的操作方法
Dec 24 #Python
You might like
PHP中用正则表达式清除字符串的空白
2011/01/17 PHP
php做下载文件的实现代码及文件名中乱码解决方法
2011/02/03 PHP
PHP实现动态web服务器方法
2015/07/29 PHP
大家在抢红包,程序员在研究红包算法
2015/08/31 PHP
php+ajax实现带进度条的上传图片功能【附demo源码下载】
2016/09/14 PHP
PHP接口并发测试的方法(推荐)
2016/12/15 PHP
php删除数组指定元素实现代码
2017/05/03 PHP
PHP 使用二进制保存用户状态的实例
2018/01/29 PHP
NodeJs中的非阻塞方法介绍
2012/06/05 NodeJs
浅析jQuery中调用ajax方法时在不同浏览器中遇到的问题
2014/06/11 Javascript
javascript实现的闭包简单实例
2015/07/17 Javascript
javascript中sort() 方法使用详解
2015/08/30 Javascript
基于JS实现checkbox全选功能实例代码
2016/10/31 Javascript
jQuery.Form上传文件操作
2017/02/05 Javascript
JS日程管理插件FullCalendar中文说明文档
2017/02/06 Javascript
简单实现js轮播图效果
2017/07/14 Javascript
手机注册发送验证码倒计时的简单实例
2017/11/15 Javascript
Vue2.X 通过AJAX动态更新数据
2018/07/17 Javascript
vue.js 双层嵌套for遍历的方法详解, 类似php foreach()
2018/09/07 Javascript
vue 动态组件(component :is) 和 dom元素限制(is)用法说明
2020/09/04 Javascript
[01:46]DOTA2上海特锦赛小组赛英文解说KotlGuy采访
2016/02/27 DOTA
[56:21]LGD vs IG 2018国际邀请赛小组赛BO2 第二场 8.18
2018/08/19 DOTA
用Python的Flask框架结合MySQL写一个内存监控程序
2015/11/07 Python
Python 多进程和数据传递的理解
2017/10/09 Python
Python DataFrame.groupby()聚合函数,分组级运算
2018/09/18 Python
python 多线程重启方法
2019/02/18 Python
Python爬虫之UserAgent的使用实例
2019/02/21 Python
使用pytorch搭建AlexNet操作(微调预训练模型及手动搭建)
2020/01/18 Python
python简单实现9宫格图片实例
2020/09/03 Python
Python通过format函数格式化显示值
2020/10/17 Python
python 获取谷歌浏览器保存的密码
2021/01/06 Python
法学研究生自我鉴定范文
2013/12/04 职场文书
优秀学生事迹材料
2014/02/08 职场文书
老师的检讨书
2014/02/23 职场文书
创业计划书之蛋糕店
2019/08/29 职场文书
微信小程序实现拍照和相册选取图片
2021/05/09 Javascript