python实现数据预处理之填充缺失值的示例


Posted in Python onDecember 22, 2017

1、给定一个数据集noise-data-1.txt,该数据集中保护大量的缺失值(空格、不完整值等)。利用“全局常量”、“均值或者中位数”来填充缺失值。

noise-data-1.txt:

5.1 3.5 1.4 0.2
4.9 3 1.4 0.2
4.7 3.2 1.3 0.2
4.6 3.1 1.5 0.2
5 3.6 1.4 0.2
5.4 3.9 1.7 0.4
4.6 3.4 1.4 0.3
5 3.4 1.5 0.2
4.4 2.9 1.4 0.2
4.9 -3.1 1.5 0.1
5.4 3.7 1.5 0.2
4.8 3.4 1.6 0.2
4.8 3 -1.4 0.1
4.3 3 1.1 0.1
5.8 4 1.2 0.2
5.7 4.4 1.5 0.4
5.4 3.9 1.3 0.4
5.1 3.5 1.4 0.3
5.7 3.8 1.7 0.3
5.1 3.8 -1.5 0.3
5.4 3.4 1.7 0.2
5.1 3.7 1.5 0.4
4.6 3.6 1 0.2
5.1 3.3 1.7 0.5
4.8 3.4 1.9 0.2

解题思路:首先读入数据,对数据进行处理,去掉空行,利用 “均值来填充缺失值,本题利用Python语言实现,代码如下:

import numpy as np
data = []
my_list = []
con=0
noise_data = open('noise-data-1.txt') 
clean_data = open("clean_data3.txt", 'w')
for line in noise_data.readlines():
 if len(line) == 0:
 break
 if line.count('\n') == len(line):
 continue 
 dataline =line.strip().split('\t')
 my_list.append(dataline)
 con+=1
for i in range(0,con):
 for j in range(0,len(my_list[i])):
 if my_list[i][j].count('.')==0:
  miss_row=[]
  for a in range(0,len(my_list[i])):
  if float(my_list[i][a])<0:
   miss_row.append(-float(my_list[i][a])) 
  miss_row.append(float(my_list[i][a])) 
  my_average=round(np.average(miss_row),1)
  my_list[i][j]=my_average
 else:
  if float(my_list[i][j])<0:
   my_list[i][j]=-float(my_list[i][j]) 
  my_list[i][j]=float(my_list[i][j]) 
print my_list
def file_write(filename,data_list):
 file1=open(filename,'w')
 for i in data_list:
 for j in i:
  if type(j)!=str:
  j=str(j)
  file1.write(j)
  file1.write(' ')
 file1.write('\n')
 file1.close()
 return file1
filename='clean_data.txt'
file_write(filename,my_list)

运行结果如下:

python实现数据预处理之填充缺失值的示例

以上这篇python实现数据预处理之填充缺失值的示例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python生成随机密码
Mar 10 Python
Django框架下在视图中使用模版的方法
Jul 16 Python
Python数据结构与算法之链表定义与用法实例详解【单链表、循环链表】
Sep 28 Python
python决策树之CART分类回归树详解
Dec 20 Python
Python模块WSGI使用详解
Feb 02 Python
python得到电脑的开机时间方法
Oct 15 Python
Python3.6实现带有简单界面的有道翻译小程序
Apr 16 Python
Django-rest-framework中过滤器的定制实例
Apr 01 Python
python3 使用openpyxl将mysql数据写入xlsx的操作
May 15 Python
Python控制台实现交互式环境执行
Jun 09 Python
Python如何进行时间处理
Aug 06 Python
Python绘制地图神器folium的新人入门指南
May 23 Python
NetworkX之Prim算法(实例讲解)
Dec 22 #Python
Python实现控制台中的进度条功能代码
Dec 22 #Python
Python中的探索性数据分析(功能式)
Dec 22 #Python
Python反射用法实例简析
Dec 22 #Python
Python文本特征抽取与向量化算法学习
Dec 22 #Python
用Python实现KNN分类算法
Dec 22 #Python
Python数据拟合与广义线性回归算法学习
Dec 22 #Python
You might like
PHP实现通过中文字符比率来判断垃圾评论的方法
2014/10/20 PHP
Zend Framework教程之Zend_Config_Xml用法分析
2016/03/23 PHP
PHP实现执行外部程序的方法详解
2017/08/17 PHP
thinkPHP通用控制器实现方法示例
2017/11/23 PHP
js导出格式化的excel 实例方法
2013/07/17 Javascript
ExtJS4 动态生成的grid导出为excel示例
2014/05/02 Javascript
Javascript中call与apply的学习笔记
2014/09/22 Javascript
jquery实现可关闭的倒计时广告特效代码
2015/09/02 Javascript
JS中微信小程序自定义底部弹出框
2016/12/22 Javascript
react-native组件中NavigatorIOS和ListView结合使用的方法
2017/09/30 Javascript
CentOS环境中MySQL修改root密码方法
2018/01/07 Javascript
JS实现获取进今年第几天是周几的方法分析
2018/06/27 Javascript
layui中使用jquery控制radio选中事件的示例代码
2018/08/15 jQuery
vuex管理状态仓库使用详解
2020/07/29 Javascript
js实现日历
2020/11/07 Javascript
vue打包通过image-webpack-loader插件对图片压缩优化操作
2020/11/12 Javascript
使用Python操作Elasticsearch数据索引的教程
2015/04/08 Python
python&amp;MongoDB爬取图书馆借阅记录
2016/02/05 Python
Python实现字符串与数组相互转换功能示例
2017/09/22 Python
Python实现读取txt文件并转换为excel的方法示例
2018/05/17 Python
Flask框架各种常见装饰器示例
2018/07/17 Python
利用python在excel里面直接使用sql函数的方法
2019/02/08 Python
Django REST Framework序列化外键获取外键的值方法
2019/07/26 Python
python实现发送form-data数据的方法详解
2019/09/27 Python
python GUI库图形界面开发之PyQt5窗口背景与不规则窗口实例
2020/02/25 Python
python随机模块random的22种函数(小结)
2020/05/15 Python
用Python实现职工信息管理系统
2020/12/30 Python
房地产销售大学生自我评价分享
2013/11/11 职场文书
教师节商场活动方案
2014/02/13 职场文书
机械设计及其自动化求职推荐信
2014/02/17 职场文书
公益广告语集锦
2014/03/13 职场文书
我们的节日中秋节活动总结
2015/03/23 职场文书
2015年机械设备管理工作总结
2015/05/04 职场文书
2015迎新晚会开场白
2015/07/17 职场文书
教师节校长致辞
2015/07/31 职场文书
总结一些Java常用的加密算法
2021/06/11 Java/Android