详解python实现数据归一化处理的方式:(0,1)标准化


Posted in Python onJuly 17, 2019

在机器学习过程中,对数据的处理过程中,常常需要对数据进行归一化处理,下面介绍(0, 1)标准化的方式,简单的说,其功能就是将预处理的数据的数值范围按一定关系“压缩”到(0,1)的范围类。

通常(0, 1)标注化处理的公式为:

详解python实现数据归一化处理的方式:(0,1)标准化

即将样本点的数值减去最小值,再除以样本点数值最大与最小的差,原理公式就是这么基础。

下面看看使用python语言来编程实现吧

import numpy as np
import matplotlib.pyplot as plt


def noramlization(data):
  minVals = data.min(0)
  maxVals = data.max(0)
  ranges = maxVals - minVals
  normData = np.zeros(np.shape(data))
  m = data.shape[0]
  normData = data - np.tile(minVals, (m, 1))
  normData = normData/np.tile(ranges, (m, 1))
  return normData, ranges, minVals


x = np.array([[78434.0829, 26829.86612], [78960.4042, 26855.13451], [72997.8308, 26543.79201],
       [74160.2849, 26499.56629], [75908.5746, 26220.11996], [74880.6989, 26196.03995],
       [74604.7169, 27096.87862], [79547.6796, 25986.68579], [74997.7791, 24021.50132],
       [74487.4915, 26040.18441], [77134.2636, 24647.274],  [74975.2792, 24067.31441],
       [76013.5305, 24566.02273], [79191.518, 26840.29867], [80653.4589, 25937.22248],
       [79185.9935, 26996.18228], [74426.881, 24227.71439], [73246.4295, 26561.59268],
       [77963.1478, 25580.05298], [74469.8778, 26082.15448], [81372.3787, 26649.69232],
       [76826.8262, 24549.77367], [77774.2608, 25999.96037], [79673.1361, 25229.04353],
       [75251.7951, 24902.72185], [78458.073, 23924.15117], [82247.5439, 29671.33493],
       [82041.2247, 27903.34268], [80083.2029, 28692.35517], [80962.0043, 28519.81002],
       [79799.8328, 28740.27736], [80743.9947, 28862.75402], [80888.449, 29724.53706],
       [81768.4638, 30180.20618], [80283.8783, 30417.55057], [79460.7078, 29092.52867],
       [75514.1202, 28071.73721], [80595.5945, 30292.25917], [80750.4876, 29651.32254],
       [80020.662, 30023.70025], [82992.3395, 29466.83067], [80185.5946, 29943.15481],
       [81854.6163, 29846.18257], [81526.4017, 30218.27078], [79174.5312, 29960.69999],
       [78112.3051, 26467.57545], [80262.4121, 29340.23218], [81284.9734, 28257.71529],
       [81928.9905, 28752.84811], [80739.2727, 29288.85126], [83135.3435, 30223.4974],
       [83131.8223, 29049.10112], [82549.9076, 28910.15209], [81574.0822, 28326.55367],
       [80507.399, 28553.56851], [82956.2103, 29157.62372], [81909.7132, 29359.24497],
       [80893.5603, 29326.64155], [82520.1272, 30424.96703], [82829.8548, 31062.24418],
       [80532.1495, 29198.10407], [80112.7963, 29143.47905], [81175.0882, 28443.10574]])

newgroup, _, _ = noramlization(x)
newdata = newgroup
plt.scatter(x[:, 0], x[:, 1], marker='*', c='r', s=24)
plt.show()
print(len(x[:, 0]))
print(len(x[:, 1]))
print(newdata)

将数据进行归一化处理后,并使用matplotlib绘制出处理后的散点图分布如下:

详解python实现数据归一化处理的方式:(0,1)标准化

可以看到数据的数值范围均为(0,1)之间了

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python程序设计入门(1)基本语法简介
Jun 13 Python
Python实现扫描局域网活动ip(扫描在线电脑)
Apr 28 Python
Python2.x版本中cmp()方法的使用教程
May 14 Python
使用Python设计一个代码统计工具
Apr 04 Python
Python中分支语句与循环语句实例详解
Sep 13 Python
Python3.5文件修改操作实例分析
May 01 Python
python求平均数、方差、中位数的例子
Aug 22 Python
PyTorch中 tensor.detach() 和 tensor.data 的区别详解
Jan 06 Python
用什么库写 Python 命令行程序(示例代码详解)
Feb 20 Python
TensorFlow tf.nn.conv2d_transpose是怎样实现反卷积的
Apr 20 Python
使用npy转image图像并保存的实例
Jul 01 Python
python实战之一步一步教你绘制小猪佩奇
Apr 22 Python
简单了解django索引的相关知识
Jul 17 #Python
python实现连连看辅助(图像识别)
Mar 25 #Python
Django中多种重定向方法使用详解
Jul 17 #Python
200行python代码实现2048游戏
Jul 17 #Python
Django后端接收嵌套Json数据及解析详解
Jul 17 #Python
Python制作微信好友背景墙教程(附完整代码)
Jul 17 #Python
python代码编写计算器小程序
Mar 30 #Python
You might like
Apache, PHP在Windows 9x/NT下的安装与配置 (二)
2006/10/09 PHP
php is_file 判断给定文件名是否为一个正常的文件
2010/05/10 PHP
查找mysql字段中固定字符串并替换的几个方法
2012/09/23 PHP
用php实现百度网盘图片直链的代码分享
2012/11/01 PHP
PHP封装请求类实例分析【基于Yii框架】
2019/10/17 PHP
PHP实现新型冠状病毒疫情实时图的实例
2020/02/04 PHP
高性能web开发 如何加载JS,JS应该放在什么位置?
2010/05/14 Javascript
为JavaScript类型增加方法的实现代码(增加功能)
2011/12/29 Javascript
瀑布流布局并自动加载实现代码
2013/03/12 Javascript
网页前端登录js按Enter回车键实现登陆的两种方法
2016/05/10 Javascript
一个仿微博登陆邮箱提示框js开发案例
2016/07/28 Javascript
js实现3d悬浮效果
2017/02/16 Javascript
详解vue与后端数据交互(ajax):vue-resource
2017/03/16 Javascript
webpack2.0配置postcss-loader的方法
2017/08/17 Javascript
Vue中使用Sortable的示例代码
2018/04/07 Javascript
js捆绑TypeScript声明文件的方法教程
2018/04/13 Javascript
vue 自定义提示框(Toast)组件的实现代码
2018/08/17 Javascript
react native 获取地理位置的方法示例
2018/08/28 Javascript
CKeditor富文本编辑器使用技巧之添加自定义插件的方法
2019/06/14 Javascript
jquery实现上传文件进度条
2020/03/26 jQuery
JS的时间格式化和时间戳转换函数示例详解
2020/07/27 Javascript
十个Python程序员易犯的错误
2015/12/15 Python
python write无法写入文件的解决方法
2019/01/23 Python
解决django前后端分离csrf验证的问题
2019/02/03 Python
详解pandas获取Dataframe元素值的几种方法
2020/06/14 Python
Python环境配置实现pip加速过程解析
2020/11/27 Python
CSS3利用text-shadow属性实现多种效果的文字样式展现方法
2016/08/25 HTML / CSS
html特殊符号示例 html特殊字符编码对照表
2014/01/14 HTML / CSS
Clarks鞋法国官方网站:英国其乐鞋品牌
2018/02/11 全球购物
Chupi官网:在爱尔兰手工制作的订婚、结婚戒指和精美珠宝
2020/09/28 全球购物
周年庆典邀请函范文
2014/01/24 职场文书
全国道德模范事迹
2014/02/01 职场文书
致百米运动员广播稿5篇
2014/10/13 职场文书
党委工作总结2015
2015/04/27 职场文书
Python如何使用logging为Flask增加logid
2021/03/30 Python
Windows Server 2016 配置 IIS 的详细步骤
2022/04/28 Servers