python实现数据预处理之填充缺失值的示例


Posted in Python onDecember 22, 2017

1、给定一个数据集noise-data-1.txt,该数据集中保护大量的缺失值(空格、不完整值等)。利用“全局常量”、“均值或者中位数”来填充缺失值。

noise-data-1.txt:

5.1 3.5 1.4 0.2
4.9 3 1.4 0.2
4.7 3.2 1.3 0.2
4.6 3.1 1.5 0.2
5 3.6 1.4 0.2
5.4 3.9 1.7 0.4
4.6 3.4 1.4 0.3
5 3.4 1.5 0.2
4.4 2.9 1.4 0.2
4.9 -3.1 1.5 0.1
5.4 3.7 1.5 0.2
4.8 3.4 1.6 0.2
4.8 3 -1.4 0.1
4.3 3 1.1 0.1
5.8 4 1.2 0.2
5.7 4.4 1.5 0.4
5.4 3.9 1.3 0.4
5.1 3.5 1.4 0.3
5.7 3.8 1.7 0.3
5.1 3.8 -1.5 0.3
5.4 3.4 1.7 0.2
5.1 3.7 1.5 0.4
4.6 3.6 1 0.2
5.1 3.3 1.7 0.5
4.8 3.4 1.9 0.2

解题思路:首先读入数据,对数据进行处理,去掉空行,利用 “均值来填充缺失值,本题利用Python语言实现,代码如下:

import numpy as np
data = []
my_list = []
con=0
noise_data = open('noise-data-1.txt') 
clean_data = open("clean_data3.txt", 'w')
for line in noise_data.readlines():
 if len(line) == 0:
 break
 if line.count('\n') == len(line):
 continue 
 dataline =line.strip().split('\t')
 my_list.append(dataline)
 con+=1
for i in range(0,con):
 for j in range(0,len(my_list[i])):
 if my_list[i][j].count('.')==0:
  miss_row=[]
  for a in range(0,len(my_list[i])):
  if float(my_list[i][a])<0:
   miss_row.append(-float(my_list[i][a])) 
  miss_row.append(float(my_list[i][a])) 
  my_average=round(np.average(miss_row),1)
  my_list[i][j]=my_average
 else:
  if float(my_list[i][j])<0:
   my_list[i][j]=-float(my_list[i][j]) 
  my_list[i][j]=float(my_list[i][j]) 
print my_list
def file_write(filename,data_list):
 file1=open(filename,'w')
 for i in data_list:
 for j in i:
  if type(j)!=str:
  j=str(j)
  file1.write(j)
  file1.write(' ')
 file1.write('\n')
 file1.close()
 return file1
filename='clean_data.txt'
file_write(filename,my_list)

运行结果如下:

python实现数据预处理之填充缺失值的示例

以上这篇python实现数据预处理之填充缺失值的示例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python Django模板的使用方法(图文)
Nov 04 Python
Python中tell()方法的使用详解
May 24 Python
Python端口扫描简单程序
Nov 10 Python
Python+Turtle动态绘制一棵树实例分享
Jan 16 Python
Python Pandas找到缺失值的位置方法
Apr 12 Python
NumPy 基本切片和索引的具体使用方法
Apr 24 Python
python处理自动化任务之同时批量修改word里面的内容的方法
Aug 23 Python
如何基于python实现不邻接植花
May 01 Python
python如何保存文本文件
Jun 07 Python
如何通过Python实现RabbitMQ延迟队列
Nov 28 Python
详解pandas apply 并行处理的几种方法
Feb 24 Python
Python数组变形的几种实现方法
May 30 Python
NetworkX之Prim算法(实例讲解)
Dec 22 #Python
Python实现控制台中的进度条功能代码
Dec 22 #Python
Python中的探索性数据分析(功能式)
Dec 22 #Python
Python反射用法实例简析
Dec 22 #Python
Python文本特征抽取与向量化算法学习
Dec 22 #Python
用Python实现KNN分类算法
Dec 22 #Python
Python数据拟合与广义线性回归算法学习
Dec 22 #Python
You might like
PHP与javascript的两种交互方式
2006/10/09 PHP
Adodb的十个实例(清晰版)
2006/12/31 PHP
PHP 进程锁定问题分析研究
2009/11/24 PHP
discuz目录文件资料汇总
2014/12/30 PHP
php强大的时间转换函数strtotime
2016/02/18 PHP
PHP的反射机制实例详解
2017/03/29 PHP
PHP $O00OO0=urldecode &amp; eval 解密,记一次商业源码的去后门
2020/09/13 PHP
js函数的引用, 关于内存的开销
2012/09/17 Javascript
jquery选择器的选择使用及性能介绍
2013/01/16 Javascript
js实现页面转发功能示例代码
2013/08/05 Javascript
window.print打印指定div实例代码
2013/12/13 Javascript
javascript模拟枚举的简单实例
2014/03/06 Javascript
javascript性能优化之DOM交互操作实例分析
2015/12/12 Javascript
关于数据与后端进行交流匹配(点亮星星)
2016/08/03 Javascript
js替换字符串中所有指定的字符(实现代码)
2016/08/17 Javascript
vue2.0 与 bootstrap datetimepicker的结合使用实例
2017/05/22 Javascript
详解React Native开源时间日期选择器组件(react-native-datetime)
2017/09/13 Javascript
JavaScript数据结构与算法之检索算法示例【二分查找法、计算重复次数】
2019/02/22 Javascript
js实现星星海特效的示例
2020/09/28 Javascript
原生JavaScript实现刮刮乐
2020/09/29 Javascript
vue中的计算属性和侦听属性
2020/11/06 Javascript
python发送arp欺骗攻击代码分析
2014/01/16 Python
教你如何在Django 1.6中正确使用 Signal
2014/06/22 Python
Python数据结构之Array用法实例
2014/10/09 Python
简单了解OpenCV是个什么东西
2017/11/10 Python
对Python3 解析html的几种操作方式小结
2019/02/16 Python
Python魔法方法功能与用法简介
2019/04/04 Python
Pandas的read_csv函数参数分析详解
2019/07/02 Python
python中最小二乘法详细讲解
2021/02/19 Python
使用html5制作loading图的示例
2014/04/14 HTML / CSS
民主评议党员自我评议范文2014
2014/09/26 职场文书
个人诉讼委托书范本
2014/10/17 职场文书
党员群众路线学习心得体会
2014/11/04 职场文书
Go语言使用select{}阻塞main函数介绍
2021/04/25 Golang
Python实现单例模式的5种方法
2021/06/15 Python
浅析Python中的套接字编程
2021/06/22 Python