Python数据预处理之数据规范化(归一化)示例


Posted in Python onJanuary 08, 2019

本文实例讲述了Python数据预处理之数据规范化。分享给大家供大家参考,具体如下:

数据规范化

为了消除指标之间的量纲和取值范围差异的影响,需要进行标准化(归一化)处理,将数据按照比例进行缩放,使之落入一个特定的区域,便于进行综合分析。

数据规范化方法主要有:

- 最小-最大规范化
- 零-均值规范化

数据示例

Python数据预处理之数据规范化(归一化)示例

代码实现

#-*- coding: utf-8 -*-
#数据规范化
import pandas as pd
import numpy as np
datafile = 'normalization_data.xls' #参数初始化
data = pd.read_excel(datafile, header = None) #读取数据
(data - data.min())/(data.max() - data.min()) #最小-最大规范化
(data - data.mean())/data.std() #零-均值规范化

从命令行可以看到下面的输出:

>>> (data-data.min())/(data.max()-data.min(
          0         1         2         3
0  0.074380  0.937291  0.923520  1.000000
1  0.619835  0.000000  0.000000  0.850941
2  0.214876  0.119565  0.813322  0.000000
3  0.000000  1.000000  1.000000  0.563676
4  1.000000  0.942308  0.996711  0.804149
5  0.264463  0.838629  0.814967  0.909310
6  0.636364  0.846990  0.786184  0.929571

>>> (data-data.mean())/data.std()
          0         1         2         3
0 -0.905383  0.635863  0.464531  0.798149
1  0.604678 -1.587675 -2.193167  0.369390
2 -0.516428 -1.304030  0.147406 -2.078279
3 -1.111301  0.784628  0.684625 -0.456906
4  1.657146  0.647765  0.675159  0.234796
5 -0.379150  0.401807  0.152139  0.537286
6  0.650438  0.421642  0.069308  0.595564

上述代码改为使用print语句打印,如下:

#-*- coding: utf-8 -*-
#数据规范化
import pandas as pd
import numpy as np
datafile = 'normalization_data.xls' #参数初始化
data = pd.read_excel(datafile, header = None) #读取数据
print((data - data.min())/(data.max() - data.min())) #最小-最大规范化
print((data - data.mean())/data.std()) #零-均值规范化

可输出如下打印结果:

          0         1         2         3
0  0.074380  0.937291  0.923520  1.000000
1  0.619835  0.000000  0.000000  0.850941
2  0.214876  0.119565  0.813322  0.000000
3  0.000000  1.000000  1.000000  0.563676
4  1.000000  0.942308  0.996711  0.804149
5  0.264463  0.838629  0.814967  0.909310
6  0.636364  0.846990  0.786184  0.929571
          0         1         2         3
0 -0.905383  0.635863  0.464531  0.798149
1  0.604678 -1.587675 -2.193167  0.369390
2 -0.516428 -1.304030  0.147406 -2.078279
3 -1.111301  0.784628  0.684625 -0.456906
4  1.657146  0.647765  0.675159  0.234796
5 -0.379150  0.401807  0.152139  0.537286
6  0.650438  0.421642  0.069308  0.595564

附:代码中使用到的normalization_data.xls点击此处本站下载

希望本文所述对大家Python程序设计有所帮助。

Python 相关文章推荐
Perl中著名的Schwartzian转换问题解决实现
Jun 02 Python
Python实现简单的文件传输与MySQL备份的脚本分享
Jan 03 Python
python 出现SyntaxError: non-keyword arg after keyword arg错误解决办法
Feb 14 Python
Python实现的矩阵转置与矩阵相乘运算示例
Mar 26 Python
python3实现高效的端口扫描
Aug 31 Python
python单例模式原理与创建方法实例分析
Oct 26 Python
python 使用递归回溯完美解决八皇后的问题
Feb 26 Python
浅谈Python里面None True False之间的区别
Jul 09 Python
Python私有属性私有方法应用实例解析
Sep 15 Python
python中if嵌套命令实例讲解
Feb 25 Python
python之基数排序的实现
Jul 26 Python
Python使用mitmproxy工具监控手机 下载手机小视频
Apr 18 Python
Python实现的拉格朗日插值法示例
Jan 08 #Python
Python3 安装PyQt5及exe打包图文教程
Jan 08 #Python
在python3中pyqt5和mayavi不兼容问题的解决方法
Jan 08 #Python
Django之模型层多表操作的实现
Jan 08 #Python
对python mayavi三维绘图的实现详解
Jan 08 #Python
利用python和ffmpeg 批量将其他图片转换为.yuv格式的方法
Jan 08 #Python
python+opencv打开摄像头,保存视频、拍照功能的实现方法
Jan 08 #Python
You might like
第1次亲密接触PHP5(1)
2006/10/09 PHP
php函数间的参数传递(值传递/引用传递)
2013/09/23 PHP
判断JavaScript对象是否可用的最正确方法分析
2008/10/03 Javascript
不同的jQuery API来处理不同的浏览器事件
2012/12/09 Javascript
jquery自动填充勾选框即把勾选框打上true
2014/03/24 Javascript
详解jQuery向动态生成的内容添加事件响应jQuery live()方法
2015/11/02 Javascript
Jquery左右滑动插件之实现超级炫酷动画效果附源码下载
2015/12/02 Javascript
React实践之Tree组件的使用方法
2017/09/30 Javascript
基于Vue、Vuex、Vue-router实现的购物商城(原生切换动画)效果
2018/01/09 Javascript
JavaScript中Array方法你该知道的正确打开方法
2018/09/11 Javascript
javascript实现固定侧边栏
2021/02/09 Javascript
Python ORM框架SQLAlchemy学习笔记之数据查询实例
2014/06/10 Python
使用基于Python的Tornado框架的HTTP客户端的教程
2015/04/24 Python
在Django中使用Sitemap的方法讲解
2015/07/22 Python
python实现将内容分行输出
2015/11/05 Python
Django中login_required装饰器的深入介绍
2017/11/24 Python
Python-OpenCV基本操作方法详解
2018/04/02 Python
Python字典生成式、集合生成式、生成器用法实例分析
2020/01/07 Python
Python操作MongoDb数据库流程详解
2020/03/05 Python
Python实现进度条和时间预估的示例代码
2020/06/02 Python
如何在Windows中安装多个python解释器
2020/06/16 Python
python定时截屏实现
2020/11/02 Python
P D PAOLA意大利官网:西班牙著名的珠宝首饰品牌
2019/09/24 全球购物
LACOSTE波兰官网:Polo衫、服装和鞋类
2020/09/29 全球购物
Net Remoting把服务器端激活两种模式
2014/01/22 面试题
Linux的文件类型
2016/07/05 面试题
幼儿园园长岗位职责
2013/11/26 职场文书
六十岁生日答谢词
2014/01/10 职场文书
大学生简短的自我评价分享
2014/02/20 职场文书
小学数学课后反思
2014/04/23 职场文书
三分钟英语演讲稿
2014/04/24 职场文书
空气环保标语
2014/06/12 职场文书
煤矿安全知识竞赛活动总结
2014/07/07 职场文书
2014年优秀党员材料
2014/12/18 职场文书
财务工作个人总结
2015/02/27 职场文书
百年校庆感言
2015/08/01 职场文书