详解python实现数据归一化处理的方式:(0,1)标准化


Posted in Python onJuly 17, 2019

在机器学习过程中,对数据的处理过程中,常常需要对数据进行归一化处理,下面介绍(0, 1)标准化的方式,简单的说,其功能就是将预处理的数据的数值范围按一定关系“压缩”到(0,1)的范围类。

通常(0, 1)标注化处理的公式为:

详解python实现数据归一化处理的方式:(0,1)标准化

即将样本点的数值减去最小值,再除以样本点数值最大与最小的差,原理公式就是这么基础。

下面看看使用python语言来编程实现吧

import numpy as np
import matplotlib.pyplot as plt


def noramlization(data):
  minVals = data.min(0)
  maxVals = data.max(0)
  ranges = maxVals - minVals
  normData = np.zeros(np.shape(data))
  m = data.shape[0]
  normData = data - np.tile(minVals, (m, 1))
  normData = normData/np.tile(ranges, (m, 1))
  return normData, ranges, minVals


x = np.array([[78434.0829, 26829.86612], [78960.4042, 26855.13451], [72997.8308, 26543.79201],
       [74160.2849, 26499.56629], [75908.5746, 26220.11996], [74880.6989, 26196.03995],
       [74604.7169, 27096.87862], [79547.6796, 25986.68579], [74997.7791, 24021.50132],
       [74487.4915, 26040.18441], [77134.2636, 24647.274],  [74975.2792, 24067.31441],
       [76013.5305, 24566.02273], [79191.518, 26840.29867], [80653.4589, 25937.22248],
       [79185.9935, 26996.18228], [74426.881, 24227.71439], [73246.4295, 26561.59268],
       [77963.1478, 25580.05298], [74469.8778, 26082.15448], [81372.3787, 26649.69232],
       [76826.8262, 24549.77367], [77774.2608, 25999.96037], [79673.1361, 25229.04353],
       [75251.7951, 24902.72185], [78458.073, 23924.15117], [82247.5439, 29671.33493],
       [82041.2247, 27903.34268], [80083.2029, 28692.35517], [80962.0043, 28519.81002],
       [79799.8328, 28740.27736], [80743.9947, 28862.75402], [80888.449, 29724.53706],
       [81768.4638, 30180.20618], [80283.8783, 30417.55057], [79460.7078, 29092.52867],
       [75514.1202, 28071.73721], [80595.5945, 30292.25917], [80750.4876, 29651.32254],
       [80020.662, 30023.70025], [82992.3395, 29466.83067], [80185.5946, 29943.15481],
       [81854.6163, 29846.18257], [81526.4017, 30218.27078], [79174.5312, 29960.69999],
       [78112.3051, 26467.57545], [80262.4121, 29340.23218], [81284.9734, 28257.71529],
       [81928.9905, 28752.84811], [80739.2727, 29288.85126], [83135.3435, 30223.4974],
       [83131.8223, 29049.10112], [82549.9076, 28910.15209], [81574.0822, 28326.55367],
       [80507.399, 28553.56851], [82956.2103, 29157.62372], [81909.7132, 29359.24497],
       [80893.5603, 29326.64155], [82520.1272, 30424.96703], [82829.8548, 31062.24418],
       [80532.1495, 29198.10407], [80112.7963, 29143.47905], [81175.0882, 28443.10574]])

newgroup, _, _ = noramlization(x)
newdata = newgroup
plt.scatter(x[:, 0], x[:, 1], marker='*', c='r', s=24)
plt.show()
print(len(x[:, 0]))
print(len(x[:, 1]))
print(newdata)

将数据进行归一化处理后,并使用matplotlib绘制出处理后的散点图分布如下:

详解python实现数据归一化处理的方式:(0,1)标准化

可以看到数据的数值范围均为(0,1)之间了

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python根据给定文件返回文件名和扩展名的方法
Mar 27 Python
Python中处理字符串之endswith()方法的使用简介
May 18 Python
Python检测一个对象是否为字符串类的方法
May 21 Python
Python简单的制作图片验证码实例
May 31 Python
老生常谈Python基础之字符编码
Jun 14 Python
Python实现采用进度条实时显示处理进度的方法
Dec 19 Python
Python基于高斯消元法计算线性方程组示例
Jan 17 Python
Pycharm以root权限运行脚本的方法
Jan 19 Python
opencv python图像梯度实例详解
Feb 04 Python
解决windows上安装tensorflow时报错,“DLL load failed: 找不到指定的模块”的问题
May 20 Python
Python爬虫代理池搭建的方法步骤
Sep 28 Python
python创建字典及相关管理操作
Apr 13 Python
简单了解django索引的相关知识
Jul 17 #Python
python实现连连看辅助(图像识别)
Mar 25 #Python
Django中多种重定向方法使用详解
Jul 17 #Python
200行python代码实现2048游戏
Jul 17 #Python
Django后端接收嵌套Json数据及解析详解
Jul 17 #Python
Python制作微信好友背景墙教程(附完整代码)
Jul 17 #Python
python代码编写计算器小程序
Mar 30 #Python
You might like
分享php代码将360浏览器导出的favdb的sqlite数据库文件转换为html
2015/12/09 PHP
php实现的统计字数函数定义与使用示例
2017/07/26 PHP
javascript replace()正则替换实现代码
2010/02/26 Javascript
过虑特殊字符输入的js代码
2010/08/05 Javascript
高亮显示web页表格行的javascript代码
2010/11/19 Javascript
ajax不执行success回调而是执行了error回调
2012/12/10 Javascript
javascript判断非数字的简单例子
2013/07/18 Javascript
js的image onload事件使用遇到的问题
2014/07/15 Javascript
javascript实现禁止复制网页内容
2014/12/16 Javascript
jQuery Timelinr实现垂直水平时间轴插件(附源码下载)
2016/02/16 Javascript
微信小程序使用第三方库Immutable.js实例详解
2016/09/27 Javascript
jQuery实现点击任意位置弹出层外关闭弹出层效果
2016/10/19 Javascript
BootStrap tooltip提示框使用小结
2016/10/26 Javascript
Node.js批量给图片加水印的方法
2016/11/15 Javascript
layui type2 通过url给iframe子页面传值的例子
2019/09/06 Javascript
[01:18:43]2014 DOTA2华西杯精英邀请赛5 24 iG VS DK
2014/05/25 DOTA
Python实现爬取知乎神回复简单爬虫代码分享
2015/01/04 Python
python集合类型用法分析
2015/04/08 Python
Python绘制3d螺旋曲线图实例代码
2017/12/20 Python
django 多数据库配置教程
2018/05/30 Python
python快速排序的实现及运行时间比较
2019/11/22 Python
python next()和iter()函数原理解析
2020/02/07 Python
Python 实现使用空值进行赋值 None
2020/03/12 Python
Python getattr()函数使用方法代码实例
2020/08/10 Python
HTML5中div、article、section的区别及使用介绍
2013/08/14 HTML / CSS
Aosom西班牙:家具在线商店
2020/06/11 全球购物
大学生职业生涯规划书模板
2014/01/18 职场文书
鲜果饮品店创业计划书
2014/01/21 职场文书
经理秘书求职自荐信范文
2014/03/23 职场文书
2014年党员整改措施范文
2014/09/21 职场文书
简历自我评价:教师师德表现自我评价
2019/04/24 职场文书
深入理解python多线程编程
2021/04/18 Python
Python time库的时间时钟处理
2021/05/02 Python
python实现语音常用度量方法的代码详解
2021/05/25 Python
《现实主义勇者的王国再建记》第三弹OST全曲试听片段公开
2022/04/04 日漫
table不让td文字溢出操作方法
2022/12/24 HTML / CSS