python缺失值填充方法示例代码


Posted in Python onDecember 24, 2022

1.找到缺失值

导入数据集

df=pd.read_csv("nba.csv")
df.head(10)

替换异常值(数据集中异常值为“-”)

把数据集中的异常值用“NaN”替换

# 将空值形式的缺失值转换成可识别的类型
data = data.replace('-', np.NaN)

2.计算缺失值的数量

用# isnull() 函数,确认各列是否有缺失值1.

null_all = df.isnull().sum()
print(null_all)

python缺失值填充方法示例代码

.sum();表示可以显示各个列的缺失值数量。

null_all = df.isnull.any(axis=1)#表示那些行具有缺失值,

.any()表示只要按行或列计算,有缺失值就算入
.all()表示所在行或列全为缺失值才计入
.sum()表示计算列缺失值时,一列有多个缺失值,同理,计算行缺失,计算有多少个行

3.处理缺失值

3.1:df.dropna():直接删除行列

df表示数据集的名称

  • dropna(axis=0, how=‘any’, thresh=None, subset=None, inplace=False)

括号内上述参数都是函数默认。

axis=0:表示对行进行删除操作,axis=1:对列删除进行操作
how=‘any’:表示维度 存在“缺失值”就删除相应行/列操作;how=‘all’:进行相关行或列删除操作时,只有所有维度缺失才删除
thresh=None:等于几表示有几个缺失值存在才会删除所在的行或列。
inplace=False:表示对原来的数据集不进行操作,True时表示对原来的数据集也进行操作。

3.2:df.fillna()填充缺失值

  • fillna(value=None, method=None, axis=None, inplace=False, limit=None, downcast=None)

axis : {0 or ‘index’, 1 or ‘columns’}

method : {‘backfill’, ‘bfill’, ‘pad’, ‘ffill’, None}
pad’, ‘ffill:将前面的值填充于后面位置。
backfill’, 'bfill:表示将后面的值填充于前面位置。

data.fillna(data.mean())#平均值填充
data.fillna(data.median())#中位数填充

3.3:KNN填充

from sklearn.impute import KNNImputer
imputer = KNNImputer(n_neighbors=4)#邻居样本求平均数
df1=imputer.fit_transform(df)

4.查看数据集的末尾

df.tail(10)

查看末尾10行

总结

到此这篇关于python缺失值填充方法的文章就介绍到这了,更多相关python缺失值填充方法内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
python操作xml文件示例
Apr 07 Python
解决windows下Sublime Text 2 运行 PyQt 不显示的方法分享
Jun 18 Python
跟老齐学Python之用while来循环
Oct 02 Python
Python实现把回车符\r\n转换成\n
Apr 23 Python
Windows 7下Python Web环境搭建图文教程
Mar 20 Python
python实现批量图片格式转换
Jun 16 Python
python调用百度地图WEB服务API获取地点对应坐标值
Jan 16 Python
python绘制直方图和密度图的实例
Jul 08 Python
numpy.ndarray 实现对特定行或列取值
Dec 05 Python
用python解压分析jar包实例
Jan 16 Python
python实现AHP算法的方法实例(层次分析法)
Sep 09 Python
Jupyter notebook 不自动弹出网页的解决方案
May 21 Python
Python  序列化反序列化和异常处理的问题小结
Dec 24 #Python
Python find()、rfind()方法及作用
Dec 24 #Python
Python使用pandas导入xlsx格式的excel文件内容操作代码
Dec 24 #Python
Python 第三方库 openpyxl 的安装过程
Dec 24 #Python
python index() 与 rindex() 方法的使用示例详解
Dec 24 #Python
python+pyhyper实现识别图片中的车牌号思路详解
Dec 24 #Python
python pandas 解析(读取、写入)CSV 文件的操作方法
Dec 24 #Python
You might like
关于我转生变成史莱姆这档事:第二季PV上线,萌王2021年回归
2020/05/06 日漫
在PHP中利用XML技术构造远程服务(上)
2006/10/09 PHP
JavaScript DOM 学习第五章 表单简介
2010/02/19 Javascript
Javascript模块化编程(一)AMD规范(规范使用模块)
2013/01/17 Javascript
JavaScript访问CSS属性的几种方式介绍
2014/07/21 Javascript
JS遍历Json字符串中键值对先转成JSON对象再遍历
2014/08/15 Javascript
javascript实现日期时间动态显示示例代码
2015/09/08 Javascript
九种原生js动画效果
2015/11/11 Javascript
浅谈javascript中的call、apply、bind
2016/03/06 Javascript
使用jQuery操作HTML的table表格的实例解析
2016/03/13 Javascript
原生JS实现匀速图片轮播动画
2016/10/18 Javascript
jQuery常见的选择器及用法介绍
2016/12/20 Javascript
利用Vue.js框架实现火车票查询系统(附源码)
2017/02/27 Javascript
jQuery插件HighCharts绘制2D饼图效果示例【附demo源码下载】
2017/03/21 jQuery
Echarts基本用法_动力节点Java学院整理
2017/08/11 Javascript
nodejs实现爬取网站图片功能
2017/12/14 NodeJs
jquery根据name取得select选中的值实例(超简单)
2018/01/25 jQuery
nodejs实现连接mongodb数据库的方法示例
2018/03/15 NodeJs
微信小程序日历组件使用方法详解
2018/12/29 Javascript
JavaScript中的各种宽高属性的实现
2020/05/08 Javascript
vue中全局路由守卫中替代this操作(this.$store/this.$vux)
2020/07/24 Javascript
python使用win32com在百度空间插入html元素示例
2014/02/20 Python
Python3.x中自定义比较函数
2015/04/24 Python
利用ctypes获取numpy数组的指针方法
2019/02/12 Python
python调用外部程序的实操步骤
2019/03/04 Python
Python3中的最大整数和最大浮点数实例
2019/07/09 Python
Python爬虫库BeautifulSoup的介绍与简单使用实例
2020/01/25 Python
Python SMTP配置参数并发送邮件
2020/06/16 Python
HTML5 progress和meter控件_动力节点Java学院整理
2017/07/06 HTML / CSS
英国复古皮包品牌:Beara Beara
2018/07/18 全球购物
美国排名第一的泳池用品直接来源:In The Swim
2019/09/23 全球购物
教师竞聘演讲稿
2014/05/16 职场文书
2014国庆节商场促销活动策划方案
2014/09/16 职场文书
公司保密管理制度
2015/08/04 职场文书
工程主管竞聘书
2015/09/15 职场文书
python-for x in range的用法(注意要点、细节)
2021/05/10 Python