Python数据预处理之数据规范化(归一化)示例


Posted in Python onJanuary 08, 2019

本文实例讲述了Python数据预处理之数据规范化。分享给大家供大家参考,具体如下:

数据规范化

为了消除指标之间的量纲和取值范围差异的影响,需要进行标准化(归一化)处理,将数据按照比例进行缩放,使之落入一个特定的区域,便于进行综合分析。

数据规范化方法主要有:

- 最小-最大规范化
- 零-均值规范化

数据示例

Python数据预处理之数据规范化(归一化)示例

代码实现

#-*- coding: utf-8 -*-
#数据规范化
import pandas as pd
import numpy as np
datafile = 'normalization_data.xls' #参数初始化
data = pd.read_excel(datafile, header = None) #读取数据
(data - data.min())/(data.max() - data.min()) #最小-最大规范化
(data - data.mean())/data.std() #零-均值规范化

从命令行可以看到下面的输出:

>>> (data-data.min())/(data.max()-data.min(
          0         1         2         3
0  0.074380  0.937291  0.923520  1.000000
1  0.619835  0.000000  0.000000  0.850941
2  0.214876  0.119565  0.813322  0.000000
3  0.000000  1.000000  1.000000  0.563676
4  1.000000  0.942308  0.996711  0.804149
5  0.264463  0.838629  0.814967  0.909310
6  0.636364  0.846990  0.786184  0.929571

>>> (data-data.mean())/data.std()
          0         1         2         3
0 -0.905383  0.635863  0.464531  0.798149
1  0.604678 -1.587675 -2.193167  0.369390
2 -0.516428 -1.304030  0.147406 -2.078279
3 -1.111301  0.784628  0.684625 -0.456906
4  1.657146  0.647765  0.675159  0.234796
5 -0.379150  0.401807  0.152139  0.537286
6  0.650438  0.421642  0.069308  0.595564

上述代码改为使用print语句打印,如下:

#-*- coding: utf-8 -*-
#数据规范化
import pandas as pd
import numpy as np
datafile = 'normalization_data.xls' #参数初始化
data = pd.read_excel(datafile, header = None) #读取数据
print((data - data.min())/(data.max() - data.min())) #最小-最大规范化
print((data - data.mean())/data.std()) #零-均值规范化

可输出如下打印结果:

          0         1         2         3
0  0.074380  0.937291  0.923520  1.000000
1  0.619835  0.000000  0.000000  0.850941
2  0.214876  0.119565  0.813322  0.000000
3  0.000000  1.000000  1.000000  0.563676
4  1.000000  0.942308  0.996711  0.804149
5  0.264463  0.838629  0.814967  0.909310
6  0.636364  0.846990  0.786184  0.929571
          0         1         2         3
0 -0.905383  0.635863  0.464531  0.798149
1  0.604678 -1.587675 -2.193167  0.369390
2 -0.516428 -1.304030  0.147406 -2.078279
3 -1.111301  0.784628  0.684625 -0.456906
4  1.657146  0.647765  0.675159  0.234796
5 -0.379150  0.401807  0.152139  0.537286
6  0.650438  0.421642  0.069308  0.595564

附:代码中使用到的normalization_data.xls点击此处本站下载

希望本文所述对大家Python程序设计有所帮助。

Python 相关文章推荐
python实现调用其他python脚本的方法
Oct 05 Python
python开发之文件操作用法实例
Nov 13 Python
用Python编写简单的微博爬虫
Mar 04 Python
JSON Web Tokens的实现原理
Apr 02 Python
Python设计实现的计算器功能完整实例
Aug 18 Python
Python中的id()函数指的什么
Oct 17 Python
Python set常用操作函数集锦
Nov 15 Python
Python切片操作深入详解
Jul 27 Python
Python turtle绘画象棋棋盘
Aug 21 Python
python3+opencv生成不规则黑白mask实例
Feb 19 Python
keras用auc做metrics以及早停实例
Jul 02 Python
python机器学习实现oneR算法(以鸢尾data为例)
Mar 03 Python
Python实现的拉格朗日插值法示例
Jan 08 #Python
Python3 安装PyQt5及exe打包图文教程
Jan 08 #Python
在python3中pyqt5和mayavi不兼容问题的解决方法
Jan 08 #Python
Django之模型层多表操作的实现
Jan 08 #Python
对python mayavi三维绘图的实现详解
Jan 08 #Python
利用python和ffmpeg 批量将其他图片转换为.yuv格式的方法
Jan 08 #Python
python+opencv打开摄像头,保存视频、拍照功能的实现方法
Jan 08 #Python
You might like
浅析php学习的路线图
2013/07/10 PHP
PHP实现的简单AES加密解密算法实例
2017/05/29 PHP
PHP自定义递归函数实现数组转JSON功能【支持GBK编码】
2018/07/17 PHP
PHP时间戳和日期相互转换操作实例小结
2018/12/18 PHP
js为空或不是对象问题的快速解决方法
2013/12/11 Javascript
node.js中的fs.read方法使用说明
2014/12/17 Javascript
JS实现图片放大镜效果的方法
2015/02/27 Javascript
chrome不支持form.submit的解决方案
2015/04/28 Javascript
JavaScript中的getTimezoneOffset()方法使用详解
2015/06/10 Javascript
javascript实现滚动效果的数字时钟实例
2016/07/21 Javascript
js多个物体运动功能实例分析
2016/12/20 Javascript
jQuery插件开发发送短信倒计时功能代码
2017/05/09 jQuery
5分钟打造简易高效的webpack常用配置
2017/07/04 Javascript
详解vue mint-ui源码解析之loadmore组件
2017/10/11 Javascript
微信小程序实现图片压缩功能
2018/01/26 Javascript
浅谈Webpack 持久化缓存实践
2018/03/22 Javascript
详解如何配置vue-cli3.0的vue.config.js
2018/08/23 Javascript
微信小程序自定义tabBar组件开发详解
2020/09/24 Javascript
在Vue里如何把网页的数据导出到Excel的方法
2020/09/30 Javascript
Python可变参数用法实例分析
2017/04/02 Python
python利用MethodType绑定方法到类示例代码
2017/08/27 Python
django echarts饼图数据动态加载的实例
2019/08/12 Python
win10下python3.8的PIL库安装过程
2020/06/08 Python
Python单元测试及unittest框架用法实例解析
2020/07/09 Python
HTML5 device access 设备访问详解
2018/05/24 HTML / CSS
SISLEY希思黎官方旗舰店:享誉全球的奢华植物美容品牌
2018/04/25 全球购物
应届中专生自荐书范文
2014/02/13 职场文书
《小石潭记》教学反思
2014/02/13 职场文书
《雪儿》教学反思
2014/04/17 职场文书
城市规划应届毕业生自荐信
2014/07/04 职场文书
2014老师三严三实对照检查材料思想汇报
2014/09/18 职场文书
老人节主持词
2015/07/04 职场文书
商业计划书范文
2019/04/24 职场文书
关于python类SortedList详解
2021/09/04 Python
Python如何快速找到多个字典中的公共键(key)
2022/04/29 Python
nginx lua 操作 mysql
2022/05/15 Servers