python缺失值填充方法示例代码


Posted in Python onDecember 24, 2022

1.找到缺失值

导入数据集

df=pd.read_csv("nba.csv")
df.head(10)

替换异常值(数据集中异常值为“-”)

把数据集中的异常值用“NaN”替换

# 将空值形式的缺失值转换成可识别的类型
data = data.replace('-', np.NaN)

2.计算缺失值的数量

用# isnull() 函数,确认各列是否有缺失值1.

null_all = df.isnull().sum()
print(null_all)

python缺失值填充方法示例代码

.sum();表示可以显示各个列的缺失值数量。

null_all = df.isnull.any(axis=1)#表示那些行具有缺失值,

.any()表示只要按行或列计算,有缺失值就算入
.all()表示所在行或列全为缺失值才计入
.sum()表示计算列缺失值时,一列有多个缺失值,同理,计算行缺失,计算有多少个行

3.处理缺失值

3.1:df.dropna():直接删除行列

df表示数据集的名称

  • dropna(axis=0, how=‘any’, thresh=None, subset=None, inplace=False)

括号内上述参数都是函数默认。

axis=0:表示对行进行删除操作,axis=1:对列删除进行操作
how=‘any’:表示维度 存在“缺失值”就删除相应行/列操作;how=‘all’:进行相关行或列删除操作时,只有所有维度缺失才删除
thresh=None:等于几表示有几个缺失值存在才会删除所在的行或列。
inplace=False:表示对原来的数据集不进行操作,True时表示对原来的数据集也进行操作。

3.2:df.fillna()填充缺失值

  • fillna(value=None, method=None, axis=None, inplace=False, limit=None, downcast=None)

axis : {0 or ‘index’, 1 or ‘columns’}

method : {‘backfill’, ‘bfill’, ‘pad’, ‘ffill’, None}
pad’, ‘ffill:将前面的值填充于后面位置。
backfill’, 'bfill:表示将后面的值填充于前面位置。

data.fillna(data.mean())#平均值填充
data.fillna(data.median())#中位数填充

3.3:KNN填充

from sklearn.impute import KNNImputer
imputer = KNNImputer(n_neighbors=4)#邻居样本求平均数
df1=imputer.fit_transform(df)

4.查看数据集的末尾

df.tail(10)

查看末尾10行

总结

到此这篇关于python缺失值填充方法的文章就介绍到这了,更多相关python缺失值填充方法内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
初步理解Python进程的信号通讯
Apr 09 Python
详解Python的collections模块中的deque双端队列结构
Jul 07 Python
python 性能提升的几种方法
Jul 15 Python
TensorFlow实现简单卷积神经网络
May 24 Python
对pandas中to_dict的用法详解
Jun 05 Python
Django重置migrations文件的方法步骤
May 01 Python
python判断所输入的任意一个正整数是否为素数的两种方法
Jun 27 Python
python 控制台单行刷新,多行刷新实例
Feb 19 Python
Python sorted对list和dict排序
Jun 09 Python
获取CSDN文章内容并转换为markdown文本的python
Sep 06 Python
python实现调用摄像头并拍照发邮箱
Apr 27 Python
python cv2图像质量压缩的算法示例
Jun 04 Python
Python  序列化反序列化和异常处理的问题小结
Dec 24 #Python
Python find()、rfind()方法及作用
Dec 24 #Python
Python使用pandas导入xlsx格式的excel文件内容操作代码
Dec 24 #Python
Python 第三方库 openpyxl 的安装过程
Dec 24 #Python
python index() 与 rindex() 方法的使用示例详解
Dec 24 #Python
python+pyhyper实现识别图片中的车牌号思路详解
Dec 24 #Python
python pandas 解析(读取、写入)CSV 文件的操作方法
Dec 24 #Python
You might like
地球防卫队:陪着奥特曼打小怪兽的人类力量 那些经典队服
2020/03/08 日漫
文件上传类
2006/10/09 PHP
php 前一天或后一天的日期
2008/06/28 PHP
通过dbi使用perl连接mysql数据库的方法
2014/04/16 PHP
四个PHP非常实用的功能
2015/09/29 PHP
php 使用html5实现多文件上传实例
2016/10/24 PHP
PHP的Trait机制原理与用法分析
2019/10/18 PHP
javascript事件模型代码
2007/07/01 Javascript
javascript模拟订火车票和退票示例
2014/04/24 Javascript
浅析基于WEB前端页面的页面内容搜索的实现思路
2014/06/10 Javascript
使用ajaxfileupload.js实现ajax上传文件php版
2014/06/26 Javascript
JS实现单行文字不间断向上滚动的方法
2015/01/29 Javascript
jquery实现华丽的可折角广告代码
2015/09/02 Javascript
JavaScript ES5标准中新增的Array方法
2016/06/28 Javascript
详解Vue2+Echarts实现多种图表数据可视化Dashboard(附源码)
2017/03/21 Javascript
详解AngularJS1.x学习directive 中‘& ’‘=’ ‘@’符号的区别使用
2017/08/23 Javascript
vuejs实现ready函数加载完之后执行某个函数的方法
2018/08/31 Javascript
详解Webpack loader 之 file-loader
2018/11/07 Javascript
Vue实现 点击显示再点击隐藏效果(点击页面空白区域也隐藏效果)
2020/01/16 Javascript
python下如何查询CS反恐精英的服务器信息
2017/01/17 Python
Python使用selenium实现网页用户名 密码 验证码自动登录功能
2018/05/16 Python
Python3.6简单的操作Mysql数据库的三个实例
2018/10/17 Python
python实现顺时针打印矩阵
2019/03/02 Python
Pandas DataFrame中的tuple元素遍历的实现
2019/10/23 Python
Flask项目中实现短信验证码和邮箱验证码功能
2019/12/05 Python
Python 面向对象之类class和对象基本用法示例
2020/02/02 Python
Python使用enumerate获取迭代元素下标
2020/02/03 Python
详解Python 重学requests发起请求的基本方式
2020/02/07 Python
html5中去掉input type date默认样式的方法
2018/09/06 HTML / CSS
Jeep牧马人、切诺基和自由人零配件:4 Wheel Drive Hardware
2017/07/02 全球购物
帕克纽约:PARKER NY
2018/12/09 全球购物
大学毕业生最详细的自我评价分享
2013/11/18 职场文书
小学学习雷锋活动总结
2014/07/03 职场文书
企业爱岗敬业演讲稿
2014/09/04 职场文书
2015年办税服务厅工作总结
2015/07/23 职场文书
中秋节作文(五年级)之关于月亮
2019/09/11 职场文书