python缺失值填充方法示例代码


Posted in Python onDecember 24, 2022

1.找到缺失值

导入数据集

df=pd.read_csv("nba.csv")
df.head(10)

替换异常值(数据集中异常值为“-”)

把数据集中的异常值用“NaN”替换

# 将空值形式的缺失值转换成可识别的类型
data = data.replace('-', np.NaN)

2.计算缺失值的数量

用# isnull() 函数,确认各列是否有缺失值1.

null_all = df.isnull().sum()
print(null_all)

python缺失值填充方法示例代码

.sum();表示可以显示各个列的缺失值数量。

null_all = df.isnull.any(axis=1)#表示那些行具有缺失值,

.any()表示只要按行或列计算,有缺失值就算入
.all()表示所在行或列全为缺失值才计入
.sum()表示计算列缺失值时,一列有多个缺失值,同理,计算行缺失,计算有多少个行

3.处理缺失值

3.1:df.dropna():直接删除行列

df表示数据集的名称

  • dropna(axis=0, how=‘any’, thresh=None, subset=None, inplace=False)

括号内上述参数都是函数默认。

axis=0:表示对行进行删除操作,axis=1:对列删除进行操作
how=‘any’:表示维度 存在“缺失值”就删除相应行/列操作;how=‘all’:进行相关行或列删除操作时,只有所有维度缺失才删除
thresh=None:等于几表示有几个缺失值存在才会删除所在的行或列。
inplace=False:表示对原来的数据集不进行操作,True时表示对原来的数据集也进行操作。

3.2:df.fillna()填充缺失值

  • fillna(value=None, method=None, axis=None, inplace=False, limit=None, downcast=None)

axis : {0 or ‘index’, 1 or ‘columns’}

method : {‘backfill’, ‘bfill’, ‘pad’, ‘ffill’, None}
pad’, ‘ffill:将前面的值填充于后面位置。
backfill’, 'bfill:表示将后面的值填充于前面位置。

data.fillna(data.mean())#平均值填充
data.fillna(data.median())#中位数填充

3.3:KNN填充

from sklearn.impute import KNNImputer
imputer = KNNImputer(n_neighbors=4)#邻居样本求平均数
df1=imputer.fit_transform(df)

4.查看数据集的末尾

df.tail(10)

查看末尾10行

总结

到此这篇关于python缺失值填充方法的文章就介绍到这了,更多相关python缺失值填充方法内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
python使用自定义user-agent抓取网页的方法
Apr 15 Python
python中threading超线程用法实例分析
May 16 Python
Python3读取zip文件信息的方法
May 22 Python
编写Python脚本把sqlAlchemy对象转换成dict的教程
May 29 Python
Python实现二分查找与bisect模块详解
Jan 13 Python
pandas ix &iloc &loc的区别
Jan 10 Python
Python基于OpenCV实现人脸检测并保存
Jul 23 Python
Python迭代器模块itertools使用原理解析
Dec 11 Python
Python操作MySQL数据库实例详解【安装、连接、增删改查等】
Jan 17 Python
PyQt5 界面显示无响应的实现
Mar 26 Python
python3 自动打印出最新版本执行的mysql2redis实例
Apr 09 Python
python内置模块之上下文管理contextlib
Jun 14 Python
Python  序列化反序列化和异常处理的问题小结
Dec 24 #Python
Python find()、rfind()方法及作用
Dec 24 #Python
Python使用pandas导入xlsx格式的excel文件内容操作代码
Dec 24 #Python
Python 第三方库 openpyxl 的安装过程
Dec 24 #Python
python index() 与 rindex() 方法的使用示例详解
Dec 24 #Python
python+pyhyper实现识别图片中的车牌号思路详解
Dec 24 #Python
python pandas 解析(读取、写入)CSV 文件的操作方法
Dec 24 #Python
You might like
虫族 Zerg 热键控制
2020/03/14 星际争霸
php/JS实现的生成随机密码(验证码)功能示例
2019/06/06 PHP
php 下 html5 XHR2 + FormData + File API 上传文件操作实例分析
2020/02/28 PHP
chrome原生方法之数组
2011/11/30 Javascript
javascript对talbe进行动态添加、删除、验证实现代码
2012/03/29 Javascript
JavaScript取得鼠标绝对位置程序代码介绍
2012/09/16 Javascript
JS 数字转换研究总结
2013/12/26 Javascript
基于jQuery全屏焦点图左右切换插件responsiveslides
2015/09/07 Javascript
如何实现移动端浏览器不显示 pc 端的广告
2015/10/15 Javascript
CSS或者JS实现鼠标悬停显示另一元素
2016/01/22 Javascript
AngularJS上拉加载问题解决方法
2016/05/23 Javascript
AngularJs表单验证实例详解
2016/05/30 Javascript
RequireJS多页面应用实例分析
2016/06/29 Javascript
canvas实现粒子时钟效果
2017/02/06 Javascript
vue2.0多条件搜索组件使用详解
2020/03/26 Javascript
微信小程序自定义带价格显示日历效果
2018/12/29 Javascript
关于在LayUI中使用AJAX提交巨坑记录
2019/10/25 Javascript
Vue中图片Src使用变量的方法
2019/10/30 Javascript
JavaScript实现答题评分功能页面
2020/06/24 Javascript
js和jquery判断数据类型的4种方法总结
2020/08/28 jQuery
[01:13:17]Secret vs NB 2018国际邀请赛小组赛BO2 第二场 8.19
2018/08/21 DOTA
浅谈Python NLP入门教程
2017/12/25 Python
python random从集合中随机选择元素的方法
2019/01/23 Python
Python Django给admin添加Action的方法实例详解
2019/04/29 Python
英国计算机产品零售商:Novatech(定制个人电脑、笔记本电脑、工作站和服务器)
2018/01/28 全球购物
英国邮购活的植物主要供应商:Gardening Direct
2019/01/28 全球购物
Ruby如何创建一个线程
2013/03/10 面试题
测控技术与仪器个人求职信范文
2013/12/30 职场文书
服装行业创业计划书范文
2014/02/05 职场文书
学习演讲稿范文
2014/05/10 职场文书
博士生导师推荐信
2014/07/08 职场文书
故宫导游词
2015/01/31 职场文书
2015中学教学工作总结
2015/07/22 职场文书
Java常用工具类汇总 附示例代码
2021/06/26 Java/Android
SQL Server #{}可以防止SQL注入
2022/05/11 SQL Server
MySQL外键约束(Foreign Key)案例详解
2022/06/28 MySQL