python缺失值填充方法示例代码


Posted in Python onDecember 24, 2022

1.找到缺失值

导入数据集

df=pd.read_csv("nba.csv")
df.head(10)

替换异常值(数据集中异常值为“-”)

把数据集中的异常值用“NaN”替换

# 将空值形式的缺失值转换成可识别的类型
data = data.replace('-', np.NaN)

2.计算缺失值的数量

用# isnull() 函数,确认各列是否有缺失值1.

null_all = df.isnull().sum()
print(null_all)

python缺失值填充方法示例代码

.sum();表示可以显示各个列的缺失值数量。

null_all = df.isnull.any(axis=1)#表示那些行具有缺失值,

.any()表示只要按行或列计算,有缺失值就算入
.all()表示所在行或列全为缺失值才计入
.sum()表示计算列缺失值时,一列有多个缺失值,同理,计算行缺失,计算有多少个行

3.处理缺失值

3.1:df.dropna():直接删除行列

df表示数据集的名称

  • dropna(axis=0, how=‘any’, thresh=None, subset=None, inplace=False)

括号内上述参数都是函数默认。

axis=0:表示对行进行删除操作,axis=1:对列删除进行操作
how=‘any’:表示维度 存在“缺失值”就删除相应行/列操作;how=‘all’:进行相关行或列删除操作时,只有所有维度缺失才删除
thresh=None:等于几表示有几个缺失值存在才会删除所在的行或列。
inplace=False:表示对原来的数据集不进行操作,True时表示对原来的数据集也进行操作。

3.2:df.fillna()填充缺失值

  • fillna(value=None, method=None, axis=None, inplace=False, limit=None, downcast=None)

axis : {0 or ‘index’, 1 or ‘columns’}

method : {‘backfill’, ‘bfill’, ‘pad’, ‘ffill’, None}
pad’, ‘ffill:将前面的值填充于后面位置。
backfill’, 'bfill:表示将后面的值填充于前面位置。

data.fillna(data.mean())#平均值填充
data.fillna(data.median())#中位数填充

3.3:KNN填充

from sklearn.impute import KNNImputer
imputer = KNNImputer(n_neighbors=4)#邻居样本求平均数
df1=imputer.fit_transform(df)

4.查看数据集的末尾

df.tail(10)

查看末尾10行

总结

到此这篇关于python缺失值填充方法的文章就介绍到这了,更多相关python缺失值填充方法内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
简洁的十分钟Python入门教程
Apr 03 Python
Python找出9个连续的空闲端口
Feb 01 Python
Python中的字符串类型基本知识学习教程
Feb 04 Python
Python实现全角半角字符互转的方法
Nov 28 Python
python rsa 加密解密
Mar 20 Python
python snownlp情感分析简易demo(分享)
Jun 04 Python
Python数据可视化库seaborn的使用总结
Jan 15 Python
python利用selenium进行浏览器爬虫
Apr 25 Python
scrapy-redis源码分析之发送POST请求详解
May 15 Python
详解字符串在Python内部是如何省内存的
Feb 03 Python
Python虚拟环境的创建和使用详解
Sep 07 Python
python实现socket简单通信的示例代码
Apr 13 Python
Python  序列化反序列化和异常处理的问题小结
Dec 24 #Python
Python find()、rfind()方法及作用
Dec 24 #Python
Python使用pandas导入xlsx格式的excel文件内容操作代码
Dec 24 #Python
Python 第三方库 openpyxl 的安装过程
Dec 24 #Python
python index() 与 rindex() 方法的使用示例详解
Dec 24 #Python
python+pyhyper实现识别图片中的车牌号思路详解
Dec 24 #Python
python pandas 解析(读取、写入)CSV 文件的操作方法
Dec 24 #Python
You might like
GBK的页面输出JSON格式的php函数
2010/02/16 PHP
php GeoIP的使用教程
2011/03/09 PHP
php中比较简单的导入phpmyadmin生成的sql文件的方法
2011/06/28 PHP
php找出指定范围内回文数且平方根也是回文数的方法
2015/03/23 PHP
PHP经典算法集锦【经典收藏】
2016/09/14 PHP
Jquery性能优化详解
2014/05/15 Javascript
JQuery判断checkbox是否选中及其它复选框操作方法合集
2015/06/01 Javascript
AngularJS中实现动画效果的方法
2016/07/28 Javascript
漂亮! js实现颜色渐变效果
2016/08/12 Javascript
浅析Javascript的自动分号插入(ASI)机制
2016/09/29 Javascript
JS声明式函数与赋值式函数实例分析
2016/12/13 Javascript
JavaScript数组操作详解
2017/02/04 Javascript
Vue 进阶教程之v-model详解
2017/05/06 Javascript
js实现分页功能
2017/05/24 Javascript
vue基础之v-bind属性、class和style用法分析
2019/03/11 Javascript
基于Vue的侧边目录组件的实现
2020/02/05 Javascript
[01:12:35]Spirit vs Navi Supermajor小组赛 A组败者组第一轮 BO3 第二场 6.2
2018/06/03 DOTA
详解Python中的文件操作
2016/08/28 Python
python pandas 时间日期的处理实现
2019/07/30 Python
Python面向对象编程基础实例分析
2020/01/17 Python
Python3合并两个有序数组代码实例
2020/08/11 Python
阿迪达斯英国官方网站:adidas英国
2019/08/13 全球购物
德国婴儿服装和婴儿用品购买网站:Baby Sweets
2019/12/08 全球购物
三年级科学教学反思
2014/01/29 职场文书
网络编辑岗位职责
2014/03/18 职场文书
党员承诺践诺书
2014/05/20 职场文书
校园活动策划方案
2014/06/13 职场文书
公司周年庆典标语
2014/10/07 职场文书
群众路线对照检查剖析材料
2014/10/09 职场文书
违纪检讨书范文
2015/01/27 职场文书
2015年社区妇联工作总结
2015/04/21 职场文书
医学生自荐信范文(2016精选篇)
2016/01/28 职场文书
高中信息技术教学反思
2016/02/16 职场文书
2016年社区植树节活动总结
2016/03/16 职场文书
如何用threejs实现实时多边形折射
2021/05/07 Javascript
webpack的移动端适配方案小结
2021/07/25 Javascript