python缺失值填充方法示例代码


Posted in Python onDecember 24, 2022

1.找到缺失值

导入数据集

df=pd.read_csv("nba.csv")
df.head(10)

替换异常值(数据集中异常值为“-”)

把数据集中的异常值用“NaN”替换

# 将空值形式的缺失值转换成可识别的类型
data = data.replace('-', np.NaN)

2.计算缺失值的数量

用# isnull() 函数,确认各列是否有缺失值1.

null_all = df.isnull().sum()
print(null_all)

python缺失值填充方法示例代码

.sum();表示可以显示各个列的缺失值数量。

null_all = df.isnull.any(axis=1)#表示那些行具有缺失值,

.any()表示只要按行或列计算,有缺失值就算入
.all()表示所在行或列全为缺失值才计入
.sum()表示计算列缺失值时,一列有多个缺失值,同理,计算行缺失,计算有多少个行

3.处理缺失值

3.1:df.dropna():直接删除行列

df表示数据集的名称

  • dropna(axis=0, how=‘any’, thresh=None, subset=None, inplace=False)

括号内上述参数都是函数默认。

axis=0:表示对行进行删除操作,axis=1:对列删除进行操作
how=‘any’:表示维度 存在“缺失值”就删除相应行/列操作;how=‘all’:进行相关行或列删除操作时,只有所有维度缺失才删除
thresh=None:等于几表示有几个缺失值存在才会删除所在的行或列。
inplace=False:表示对原来的数据集不进行操作,True时表示对原来的数据集也进行操作。

3.2:df.fillna()填充缺失值

  • fillna(value=None, method=None, axis=None, inplace=False, limit=None, downcast=None)

axis : {0 or ‘index’, 1 or ‘columns’}

method : {‘backfill’, ‘bfill’, ‘pad’, ‘ffill’, None}
pad’, ‘ffill:将前面的值填充于后面位置。
backfill’, 'bfill:表示将后面的值填充于前面位置。

data.fillna(data.mean())#平均值填充
data.fillna(data.median())#中位数填充

3.3:KNN填充

from sklearn.impute import KNNImputer
imputer = KNNImputer(n_neighbors=4)#邻居样本求平均数
df1=imputer.fit_transform(df)

4.查看数据集的末尾

df.tail(10)

查看末尾10行

总结

到此这篇关于python缺失值填充方法的文章就介绍到这了,更多相关python缺失值填充方法内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
用Python的线程来解决生产者消费问题的示例
Apr 02 Python
Python中的anydbm模版和shelve模版使用指南
Jul 09 Python
Python实现分割文件及合并文件的方法
Jul 10 Python
Python内建函数之raw_input()与input()代码解析
Oct 26 Python
python使用正则表达式来获取文件名的前缀方法
Oct 21 Python
pandas通过索引进行排序的示例
Nov 16 Python
python linecache 处理固定格式文本数据的方法
Jan 08 Python
Python实现的删除重复文件或图片功能示例【去重】
Apr 23 Python
使用python写一个自动浏览文章的脚本实例
Dec 05 Python
Python实现word2Vec model过程解析
Dec 16 Python
keras得到每层的系数方式
Jun 15 Python
tensorflow2.0教程之Keras快速入门
Feb 20 Python
Python  序列化反序列化和异常处理的问题小结
Dec 24 #Python
Python find()、rfind()方法及作用
Dec 24 #Python
Python使用pandas导入xlsx格式的excel文件内容操作代码
Dec 24 #Python
Python 第三方库 openpyxl 的安装过程
Dec 24 #Python
python index() 与 rindex() 方法的使用示例详解
Dec 24 #Python
python+pyhyper实现识别图片中的车牌号思路详解
Dec 24 #Python
python pandas 解析(读取、写入)CSV 文件的操作方法
Dec 24 #Python
You might like
用PHP的ob_start();控制您的浏览器cache!
2006/11/25 PHP
php中最简单的字符串匹配算法
2014/12/16 PHP
浅析Yii2中GridView常见操作
2016/04/22 PHP
PHP实现表单提交数据的验证处理功能【防SQL注入和XSS攻击等】
2017/07/21 PHP
YII2框架中actions的作用与使用方法示例
2020/03/13 PHP
jQuery EasyUI API 中文文档 - DataGrid数据表格
2011/11/17 Javascript
JS上传图片前的限制包括(jpg jpg gif及大小高宽)等
2012/12/19 Javascript
javascript中attribute和property的区别详解
2014/06/05 Javascript
网站基于flash实现的Banner图切换效果代码
2014/10/14 Javascript
在JavaScript中使用对数Math.log()方法的教程
2015/06/15 Javascript
JS实现漂亮的淡蓝色滑动门效果代码
2015/09/23 Javascript
win7下安装配置node.js+express开发环境
2015/12/06 Javascript
JavaScript中动态向表格添加数据
2017/01/24 Javascript
Angular使用$http.jsonp发送跨站请求的方法
2017/03/16 Javascript
jQuery正则验证注册页面经典实例
2017/06/10 jQuery
vue利用better-scroll实现轮播图与页面滚动详解
2017/10/20 Javascript
VSCode 配置React Native开发环境的方法
2017/12/27 Javascript
基于jQuery实现无缝轮播与左右点击效果
2018/05/13 jQuery
Vuejs2 + Webpack框架里,模拟下载的实例讲解
2018/09/05 Javascript
微信小程序用户授权、位置授权及获取微信绑定手机号
2019/07/18 Javascript
Vue中点击active并第一个默认选中功能的实现
2020/02/24 Javascript
使用Vue Composition API写出清晰、可扩展的表单实现
2020/06/10 Javascript
Python 多线程抓取图片效率对比
2016/02/27 Python
python fabric实现远程部署
2017/01/05 Python
Python数据结构与算法之图的广度优先与深度优先搜索算法示例
2017/12/14 Python
django 自定义过滤器的实现
2019/02/26 Python
解决Python安装时报缺少DLL问题【两种解决方法】
2019/07/15 Python
python文件绝对路径写法介绍(windows)
2019/12/25 Python
TensorFlow dataset.shuffle、batch、repeat的使用详解
2020/01/21 Python
Python descriptor(描述符)的实现
2020/11/15 Python
HTML5中微数据概述及在搜索引擎中的使用举例
2013/02/07 HTML / CSS
巴西男士胡须和头发护理产品商店:Beard
2017/11/13 全球购物
澳大利亚排名第一的儿童在线玩具商店:Toy Galaxy
2018/10/06 全球购物
党校自我鉴定范文
2013/10/02 职场文书
教师师德反思材料
2014/02/15 职场文书
大班幼儿评语大全
2014/04/30 职场文书