python缺失值填充方法示例代码


Posted in Python onDecember 24, 2022

1.找到缺失值

导入数据集

df=pd.read_csv("nba.csv")
df.head(10)

替换异常值(数据集中异常值为“-”)

把数据集中的异常值用“NaN”替换

# 将空值形式的缺失值转换成可识别的类型
data = data.replace('-', np.NaN)

2.计算缺失值的数量

用# isnull() 函数,确认各列是否有缺失值1.

null_all = df.isnull().sum()
print(null_all)

python缺失值填充方法示例代码

.sum();表示可以显示各个列的缺失值数量。

null_all = df.isnull.any(axis=1)#表示那些行具有缺失值,

.any()表示只要按行或列计算,有缺失值就算入
.all()表示所在行或列全为缺失值才计入
.sum()表示计算列缺失值时,一列有多个缺失值,同理,计算行缺失,计算有多少个行

3.处理缺失值

3.1:df.dropna():直接删除行列

df表示数据集的名称

  • dropna(axis=0, how=‘any’, thresh=None, subset=None, inplace=False)

括号内上述参数都是函数默认。

axis=0:表示对行进行删除操作,axis=1:对列删除进行操作
how=‘any’:表示维度 存在“缺失值”就删除相应行/列操作;how=‘all’:进行相关行或列删除操作时,只有所有维度缺失才删除
thresh=None:等于几表示有几个缺失值存在才会删除所在的行或列。
inplace=False:表示对原来的数据集不进行操作,True时表示对原来的数据集也进行操作。

3.2:df.fillna()填充缺失值

  • fillna(value=None, method=None, axis=None, inplace=False, limit=None, downcast=None)

axis : {0 or ‘index’, 1 or ‘columns’}

method : {‘backfill’, ‘bfill’, ‘pad’, ‘ffill’, None}
pad’, ‘ffill:将前面的值填充于后面位置。
backfill’, 'bfill:表示将后面的值填充于前面位置。

data.fillna(data.mean())#平均值填充
data.fillna(data.median())#中位数填充

3.3:KNN填充

from sklearn.impute import KNNImputer
imputer = KNNImputer(n_neighbors=4)#邻居样本求平均数
df1=imputer.fit_transform(df)

4.查看数据集的末尾

df.tail(10)

查看末尾10行

总结

到此这篇关于python缺失值填充方法的文章就介绍到这了,更多相关python缺失值填充方法内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
十个Python程序员易犯的错误
Dec 15 Python
Python中str.format()详解
Mar 12 Python
python 将数据保存为excel的xls格式(实例讲解)
May 03 Python
python smtplib模块自动收发邮件功能(二)
May 22 Python
kaggle+mnist实现手写字体识别
Jul 26 Python
python3 打开外部程序及关闭的示例
Nov 06 Python
pyinstaller参数介绍以及总结详解
Jul 12 Python
python调用c++返回带成员指针的类指针实例
Dec 12 Python
python 实现Flask中返回图片流给前端展示
Jan 09 Python
Python写捕鱼达人的游戏实现
Mar 31 Python
python将数据插入数据库的代码分享
Aug 16 Python
详解Python牛顿插值法
May 11 Python
Python  序列化反序列化和异常处理的问题小结
Dec 24 #Python
Python find()、rfind()方法及作用
Dec 24 #Python
Python使用pandas导入xlsx格式的excel文件内容操作代码
Dec 24 #Python
Python 第三方库 openpyxl 的安装过程
Dec 24 #Python
python index() 与 rindex() 方法的使用示例详解
Dec 24 #Python
python+pyhyper实现识别图片中的车牌号思路详解
Dec 24 #Python
python pandas 解析(读取、写入)CSV 文件的操作方法
Dec 24 #Python
You might like
重置版宣传动画
2020/04/09 魔兽争霸
《雄兵连》《烈阳天道》真的来了
2020/07/13 国漫
PHP MemCached高级缓存配置图文教程
2010/08/05 PHP
php GeoIP的使用教程
2011/03/09 PHP
客户端脚本中常常出现的一些问题和调试技巧
2007/01/09 Javascript
EXTJS内使用ACTIVEX控件引起崩溃问题的解决方法
2010/03/31 Javascript
基于jQuery的让非HTML5浏览器支持placeholder属性的代码
2011/05/24 Javascript
js Date概念详细介绍
2013/11/22 Javascript
纯css实现窗户玻璃雨滴逼真效果
2015/08/23 Javascript
jQuery的deferred对象使用详解
2016/09/25 Javascript
AngularJS控制器之间的通信方式详解
2016/11/03 Javascript
javascript正则表达式模糊匹配IP地址功能示例
2017/01/06 Javascript
javascript删除html标签函数cIsHTML
2017/01/09 Javascript
深入理解nodejs中Express的中间件
2017/05/19 NodeJs
详解基于vue的服务端渲染框架NUXT
2018/06/20 Javascript
react基本安装与测试示例
2020/04/27 Javascript
javascript+css实现俄罗斯方块小游戏
2020/06/28 Javascript
JavaScript语法约定和程序调试原理解析
2020/11/03 Javascript
jquery实现图片放大镜效果
2020/12/23 jQuery
python计算最小优先级队列代码分享
2013/12/18 Python
使用Python编写提取日志中的中文的脚本的方法
2015/04/30 Python
Python3.5.3下配置opencv3.2.0的操作方法
2018/04/02 Python
Python字典fromkeys()方法使用代码实例
2020/07/20 Python
Python colormap库的安装和使用详情
2020/10/06 Python
CSS3中文字镂空、透明值、阴影效果设置示例小结
2016/03/07 HTML / CSS
Vivo俄罗斯官方在线商店:中国智能手机品牌
2019/10/04 全球购物
师范毕业生自荐信
2013/10/17 职场文书
大学生学习自我评价
2014/01/13 职场文书
表彰大会主持词
2014/03/26 职场文书
鉴定评语大全
2014/05/05 职场文书
小学教师个人先进事迹材料
2014/05/17 职场文书
出纳试用期自我评价
2015/03/10 职场文书
驳回起诉裁定书
2015/05/19 职场文书
详解MindSpore自定义模型损失函数
2021/06/30 Python
如何避免mysql启动时错误及sock文件作用分析
2022/01/22 MySQL
Tomcat项目启动失败的原因和解决办法
2022/04/20 Servers