Python数据预处理之数据规范化(归一化)示例


Posted in Python onJanuary 08, 2019

本文实例讲述了Python数据预处理之数据规范化。分享给大家供大家参考,具体如下:

数据规范化

为了消除指标之间的量纲和取值范围差异的影响,需要进行标准化(归一化)处理,将数据按照比例进行缩放,使之落入一个特定的区域,便于进行综合分析。

数据规范化方法主要有:

- 最小-最大规范化
- 零-均值规范化

数据示例

Python数据预处理之数据规范化(归一化)示例

代码实现

#-*- coding: utf-8 -*-
#数据规范化
import pandas as pd
import numpy as np
datafile = 'normalization_data.xls' #参数初始化
data = pd.read_excel(datafile, header = None) #读取数据
(data - data.min())/(data.max() - data.min()) #最小-最大规范化
(data - data.mean())/data.std() #零-均值规范化

从命令行可以看到下面的输出:

>>> (data-data.min())/(data.max()-data.min(
          0         1         2         3
0  0.074380  0.937291  0.923520  1.000000
1  0.619835  0.000000  0.000000  0.850941
2  0.214876  0.119565  0.813322  0.000000
3  0.000000  1.000000  1.000000  0.563676
4  1.000000  0.942308  0.996711  0.804149
5  0.264463  0.838629  0.814967  0.909310
6  0.636364  0.846990  0.786184  0.929571

>>> (data-data.mean())/data.std()
          0         1         2         3
0 -0.905383  0.635863  0.464531  0.798149
1  0.604678 -1.587675 -2.193167  0.369390
2 -0.516428 -1.304030  0.147406 -2.078279
3 -1.111301  0.784628  0.684625 -0.456906
4  1.657146  0.647765  0.675159  0.234796
5 -0.379150  0.401807  0.152139  0.537286
6  0.650438  0.421642  0.069308  0.595564

上述代码改为使用print语句打印,如下:

#-*- coding: utf-8 -*-
#数据规范化
import pandas as pd
import numpy as np
datafile = 'normalization_data.xls' #参数初始化
data = pd.read_excel(datafile, header = None) #读取数据
print((data - data.min())/(data.max() - data.min())) #最小-最大规范化
print((data - data.mean())/data.std()) #零-均值规范化

可输出如下打印结果:

          0         1         2         3
0  0.074380  0.937291  0.923520  1.000000
1  0.619835  0.000000  0.000000  0.850941
2  0.214876  0.119565  0.813322  0.000000
3  0.000000  1.000000  1.000000  0.563676
4  1.000000  0.942308  0.996711  0.804149
5  0.264463  0.838629  0.814967  0.909310
6  0.636364  0.846990  0.786184  0.929571
          0         1         2         3
0 -0.905383  0.635863  0.464531  0.798149
1  0.604678 -1.587675 -2.193167  0.369390
2 -0.516428 -1.304030  0.147406 -2.078279
3 -1.111301  0.784628  0.684625 -0.456906
4  1.657146  0.647765  0.675159  0.234796
5 -0.379150  0.401807  0.152139  0.537286
6  0.650438  0.421642  0.069308  0.595564

附:代码中使用到的normalization_data.xls点击此处本站下载

希望本文所述对大家Python程序设计有所帮助。

Python 相关文章推荐
Python实现把回车符\r\n转换成\n
Apr 23 Python
Python中encode()方法的使用简介
May 18 Python
flask中使用蓝图将路由分开写在不同文件实例解析
Jan 19 Python
Python3利用Dlib19.7实现摄像头人脸识别的方法
May 11 Python
详解Python3.6的py文件打包生成exe
Jul 13 Python
python 实现调用子文件下的模块方法
Dec 07 Python
Python列表list排列组合操作示例
Dec 18 Python
详解Python 定时框架 Apscheduler原理及安装过程
Jun 14 Python
Python PyCharm如何进行断点调试
Jul 05 Python
python3.6使用SMTP协议发送邮件
May 20 Python
Python jiaba库的使用详解
Nov 23 Python
Python中itertools库的四个函数介绍
Apr 06 Python
Python实现的拉格朗日插值法示例
Jan 08 #Python
Python3 安装PyQt5及exe打包图文教程
Jan 08 #Python
在python3中pyqt5和mayavi不兼容问题的解决方法
Jan 08 #Python
Django之模型层多表操作的实现
Jan 08 #Python
对python mayavi三维绘图的实现详解
Jan 08 #Python
利用python和ffmpeg 批量将其他图片转换为.yuv格式的方法
Jan 08 #Python
python+opencv打开摄像头,保存视频、拍照功能的实现方法
Jan 08 #Python
You might like
php iconv() : Detected an illegal character in input string
2010/12/05 PHP
PHP中的排序函数sort、asort、rsort、krsort、ksort区别分析
2014/08/18 PHP
深入理解PHP中的Streams工具
2015/07/03 PHP
原生PHP实现导出csv格式Excel文件的方法示例【附源码下载】
2019/03/07 PHP
PHP中命名空间的使用例子
2019/03/22 PHP
ThinkPHP3.2.3框架Memcache缓存使用方法实例总结
2019/04/15 PHP
非常好的js代码
2006/06/27 Javascript
JavaScript 继承详解(三)
2009/07/13 Javascript
JavaScript中各种编码解码函数的区别和注意事项
2010/08/19 Javascript
EXT窗口Window及对话框MessageBox
2011/01/27 Javascript
计算世界完全对称日的js代码,粗糙版
2011/11/04 Javascript
javascript中clipboardData对象用法详解
2015/05/13 Javascript
javascript Promise简单学习使用方法小结
2016/05/17 Javascript
老生常谈JavaScript数组的用法
2016/06/10 Javascript
如何提高数据访问速度
2016/12/26 Javascript
php输出全部gb2312编码内的汉字方法
2017/03/04 Javascript
关于JavaScript中高阶函数的魅力详解
2018/09/07 Javascript
详解ES6中的 Set Map 数据结构学习总结
2018/11/06 Javascript
JS中使用new Option()实现时间联动效果
2018/12/10 Javascript
微信小程序中转义字符的处理方法
2019/03/28 Javascript
jQuery实现倒计时功能完整示例
2020/06/01 jQuery
解决vue打包报错Unexpected token: punc的问题
2020/10/24 Javascript
[01:14]TI珍贵瞬间系列(六):冠军
2020/08/30 DOTA
Python写入CSV文件的方法
2015/07/08 Python
python常用函数详解
2016/09/13 Python
高质量Python代码编写的5个优化技巧
2017/11/16 Python
python 统计数组中元素出现次数并进行排序的实例
2018/07/02 Python
解决TensorFlow模型恢复报错的问题
2020/02/06 Python
Django实现从数据库中获取到的数据转换为dict
2020/03/27 Python
python线性插值解析
2020/07/05 Python
Python绘图之柱形图绘制详解
2020/07/28 Python
Python解析m3u8拼接下载mp4视频文件的示例代码
2021/03/03 Python
十八大报告观后感
2014/01/28 职场文书
经贸韩语专业大学生职业规划
2014/02/14 职场文书
课程设计的心得体会
2014/09/03 职场文书
法人身份证明书
2014/10/08 职场文书