详解python实现数据归一化处理的方式:(0,1)标准化


Posted in Python onJuly 17, 2019

在机器学习过程中,对数据的处理过程中,常常需要对数据进行归一化处理,下面介绍(0, 1)标准化的方式,简单的说,其功能就是将预处理的数据的数值范围按一定关系“压缩”到(0,1)的范围类。

通常(0, 1)标注化处理的公式为:

详解python实现数据归一化处理的方式:(0,1)标准化

即将样本点的数值减去最小值,再除以样本点数值最大与最小的差,原理公式就是这么基础。

下面看看使用python语言来编程实现吧

import numpy as np
import matplotlib.pyplot as plt


def noramlization(data):
  minVals = data.min(0)
  maxVals = data.max(0)
  ranges = maxVals - minVals
  normData = np.zeros(np.shape(data))
  m = data.shape[0]
  normData = data - np.tile(minVals, (m, 1))
  normData = normData/np.tile(ranges, (m, 1))
  return normData, ranges, minVals


x = np.array([[78434.0829, 26829.86612], [78960.4042, 26855.13451], [72997.8308, 26543.79201],
       [74160.2849, 26499.56629], [75908.5746, 26220.11996], [74880.6989, 26196.03995],
       [74604.7169, 27096.87862], [79547.6796, 25986.68579], [74997.7791, 24021.50132],
       [74487.4915, 26040.18441], [77134.2636, 24647.274],  [74975.2792, 24067.31441],
       [76013.5305, 24566.02273], [79191.518, 26840.29867], [80653.4589, 25937.22248],
       [79185.9935, 26996.18228], [74426.881, 24227.71439], [73246.4295, 26561.59268],
       [77963.1478, 25580.05298], [74469.8778, 26082.15448], [81372.3787, 26649.69232],
       [76826.8262, 24549.77367], [77774.2608, 25999.96037], [79673.1361, 25229.04353],
       [75251.7951, 24902.72185], [78458.073, 23924.15117], [82247.5439, 29671.33493],
       [82041.2247, 27903.34268], [80083.2029, 28692.35517], [80962.0043, 28519.81002],
       [79799.8328, 28740.27736], [80743.9947, 28862.75402], [80888.449, 29724.53706],
       [81768.4638, 30180.20618], [80283.8783, 30417.55057], [79460.7078, 29092.52867],
       [75514.1202, 28071.73721], [80595.5945, 30292.25917], [80750.4876, 29651.32254],
       [80020.662, 30023.70025], [82992.3395, 29466.83067], [80185.5946, 29943.15481],
       [81854.6163, 29846.18257], [81526.4017, 30218.27078], [79174.5312, 29960.69999],
       [78112.3051, 26467.57545], [80262.4121, 29340.23218], [81284.9734, 28257.71529],
       [81928.9905, 28752.84811], [80739.2727, 29288.85126], [83135.3435, 30223.4974],
       [83131.8223, 29049.10112], [82549.9076, 28910.15209], [81574.0822, 28326.55367],
       [80507.399, 28553.56851], [82956.2103, 29157.62372], [81909.7132, 29359.24497],
       [80893.5603, 29326.64155], [82520.1272, 30424.96703], [82829.8548, 31062.24418],
       [80532.1495, 29198.10407], [80112.7963, 29143.47905], [81175.0882, 28443.10574]])

newgroup, _, _ = noramlization(x)
newdata = newgroup
plt.scatter(x[:, 0], x[:, 1], marker='*', c='r', s=24)
plt.show()
print(len(x[:, 0]))
print(len(x[:, 1]))
print(newdata)

将数据进行归一化处理后,并使用matplotlib绘制出处理后的散点图分布如下:

详解python实现数据归一化处理的方式:(0,1)标准化

可以看到数据的数值范围均为(0,1)之间了

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python基础教程之字典操作详解
Mar 25 Python
python中合并两个文本文件并按照姓名首字母排序的例子
Apr 25 Python
举例讲解Python设计模式编程的代理模式与抽象工厂模式
Jan 16 Python
Python对数据库操作
Mar 28 Python
python实现斐波那契数列的方法示例
Jan 12 Python
Python tornado队列示例-一个并发web爬虫代码分享
Jan 09 Python
python 读入多行数据的实例
Apr 19 Python
python 同时运行多个程序的实例
Jan 07 Python
关于Pytorch的MNIST数据集的预处理详解
Jan 10 Python
如何理解Python中的变量
Jun 01 Python
详解Python中的路径问题
Sep 02 Python
Django 实现jwt认证的示例
Apr 30 Python
简单了解django索引的相关知识
Jul 17 #Python
python实现连连看辅助(图像识别)
Mar 25 #Python
Django中多种重定向方法使用详解
Jul 17 #Python
200行python代码实现2048游戏
Jul 17 #Python
Django后端接收嵌套Json数据及解析详解
Jul 17 #Python
Python制作微信好友背景墙教程(附完整代码)
Jul 17 #Python
python代码编写计算器小程序
Mar 30 #Python
You might like
社区(php&&mysql)一
2006/10/09 PHP
PHP strip_tags()去除HTML、XML以及PHP的标签介绍
2014/02/18 PHP
php的declare控制符和ticks教程(附示例)
2014/03/21 PHP
PHP设计模式入门之迭代器模式原理与实现方法分析
2020/04/26 PHP
javascript 异常处理使用总结
2009/06/21 Javascript
js实现的日期操作类DateTime函数代码
2010/03/16 Javascript
JavaScript面向对象程序设计三 原型模式(上)
2011/12/21 Javascript
table对象中的insertRow与deleteRow使用示例
2014/01/26 Javascript
JavaScript函数获取事件源的小例子
2014/05/14 Javascript
Javascript基础教程之函数对象和属性
2015/01/18 Javascript
jQuery使用Selectator插件实现多选下拉列表过滤框(附源码下载)
2016/04/08 Javascript
AngularJS入门教程之控制器详解
2016/07/27 Javascript
Node.js中路径处理模块path详解
2016/11/14 Javascript
bootstrap提示标签、提示框实现代码
2016/12/28 Javascript
Node.js 使用流实现读写同步边读边写功能
2017/09/11 Javascript
基于 flexible 的 Vue 组件:Toast -- 显示框效果
2017/12/26 Javascript
iview中Select 选择器多选校验方法
2018/03/15 Javascript
对vue里函数的调用顺序介绍
2018/03/17 Javascript
layui 实现加载动画以及非真实加载进度的方法
2019/09/23 Javascript
Jquery如何使用animation动画效果改变背景色的代码
2020/07/20 jQuery
修改NPM全局模式的默认安装路径的方法
2020/12/15 Javascript
[03:43]TI9战队采访——PSG.LGD
2019/08/22 DOTA
复制粘贴功能的Python程序
2008/04/04 Python
Python 元类使用说明
2009/12/18 Python
python爬虫自动创建文件夹的功能
2018/08/01 Python
python读取Excel实例详解
2018/08/17 Python
python 列表、字典和集合的添加和删除操作
2019/12/16 Python
Python OpenCV去除字母后面的杂线操作
2020/07/05 Python
Django 实现图片上传和下载功能
2020/12/31 Python
Linux的文件类型
2012/03/07 面试题
难忘的一天教学反思
2014/04/30 职场文书
2015财务年终工作总结范文
2015/05/22 职场文书
2015年工商局个人工作总结
2015/07/23 职场文书
导游词之南昌滕王阁
2019/11/29 职场文书
使用golang编写一个并发工作队列
2021/05/08 Golang
Redis高并发防止秒杀超卖实战源码解决方案
2021/11/01 Redis