Python数据预处理之数据规范化(归一化)示例


Posted in Python onJanuary 08, 2019

本文实例讲述了Python数据预处理之数据规范化。分享给大家供大家参考,具体如下:

数据规范化

为了消除指标之间的量纲和取值范围差异的影响,需要进行标准化(归一化)处理,将数据按照比例进行缩放,使之落入一个特定的区域,便于进行综合分析。

数据规范化方法主要有:

- 最小-最大规范化
- 零-均值规范化

数据示例

Python数据预处理之数据规范化(归一化)示例

代码实现

#-*- coding: utf-8 -*-
#数据规范化
import pandas as pd
import numpy as np
datafile = 'normalization_data.xls' #参数初始化
data = pd.read_excel(datafile, header = None) #读取数据
(data - data.min())/(data.max() - data.min()) #最小-最大规范化
(data - data.mean())/data.std() #零-均值规范化

从命令行可以看到下面的输出:

>>> (data-data.min())/(data.max()-data.min(
          0         1         2         3
0  0.074380  0.937291  0.923520  1.000000
1  0.619835  0.000000  0.000000  0.850941
2  0.214876  0.119565  0.813322  0.000000
3  0.000000  1.000000  1.000000  0.563676
4  1.000000  0.942308  0.996711  0.804149
5  0.264463  0.838629  0.814967  0.909310
6  0.636364  0.846990  0.786184  0.929571

>>> (data-data.mean())/data.std()
          0         1         2         3
0 -0.905383  0.635863  0.464531  0.798149
1  0.604678 -1.587675 -2.193167  0.369390
2 -0.516428 -1.304030  0.147406 -2.078279
3 -1.111301  0.784628  0.684625 -0.456906
4  1.657146  0.647765  0.675159  0.234796
5 -0.379150  0.401807  0.152139  0.537286
6  0.650438  0.421642  0.069308  0.595564

上述代码改为使用print语句打印,如下:

#-*- coding: utf-8 -*-
#数据规范化
import pandas as pd
import numpy as np
datafile = 'normalization_data.xls' #参数初始化
data = pd.read_excel(datafile, header = None) #读取数据
print((data - data.min())/(data.max() - data.min())) #最小-最大规范化
print((data - data.mean())/data.std()) #零-均值规范化

可输出如下打印结果:

          0         1         2         3
0  0.074380  0.937291  0.923520  1.000000
1  0.619835  0.000000  0.000000  0.850941
2  0.214876  0.119565  0.813322  0.000000
3  0.000000  1.000000  1.000000  0.563676
4  1.000000  0.942308  0.996711  0.804149
5  0.264463  0.838629  0.814967  0.909310
6  0.636364  0.846990  0.786184  0.929571
          0         1         2         3
0 -0.905383  0.635863  0.464531  0.798149
1  0.604678 -1.587675 -2.193167  0.369390
2 -0.516428 -1.304030  0.147406 -2.078279
3 -1.111301  0.784628  0.684625 -0.456906
4  1.657146  0.647765  0.675159  0.234796
5 -0.379150  0.401807  0.152139  0.537286
6  0.650438  0.421642  0.069308  0.595564

附:代码中使用到的normalization_data.xls点击此处本站下载

希望本文所述对大家Python程序设计有所帮助。

Python 相关文章推荐
重命名批处理python脚本
Apr 05 Python
python strip()函数 介绍
May 24 Python
python数据库操作常用功能使用详解(创建表/插入数据/获取数据)
Dec 06 Python
Python使用bs4获取58同城城市分类的方法
Jul 08 Python
Python中绑定与未绑定的类方法用法分析
Apr 29 Python
python中学习K-Means和图片压缩
Nov 20 Python
python编写Logistic逻辑回归
Dec 30 Python
python中copy()与deepcopy()的区别小结
Aug 03 Python
python实现彩票系统
Jun 28 Python
python 实现批量xls文件转csv文件的方法
Oct 23 Python
python 爬虫百度地图的信息界面的实现方法
Oct 27 Python
TensorFlow-gpu和opencv安装详细教程
Jun 30 Python
Python实现的拉格朗日插值法示例
Jan 08 #Python
Python3 安装PyQt5及exe打包图文教程
Jan 08 #Python
在python3中pyqt5和mayavi不兼容问题的解决方法
Jan 08 #Python
Django之模型层多表操作的实现
Jan 08 #Python
对python mayavi三维绘图的实现详解
Jan 08 #Python
利用python和ffmpeg 批量将其他图片转换为.yuv格式的方法
Jan 08 #Python
python+opencv打开摄像头,保存视频、拍照功能的实现方法
Jan 08 #Python
You might like
PHP5全版本绕过open_basedir读文件脚本漏洞详细介绍
2015/01/20 PHP
iOS自定义提示弹出框实现类似UIAlertView的效果
2016/11/16 PHP
2020最新版 PhpStudy V8.1版本下载安装使用详解
2020/10/30 PHP
用JavaScript调用WebService的示例
2008/04/07 Javascript
js 中 document.createEvent的用法
2010/08/29 Javascript
简述AngularJS相关的一些编程思想
2015/06/23 Javascript
easyui中combotree循环获取父节点至根节点并输出路径实现方法
2016/11/10 Javascript
jQuery常见面试题之DOM操作详析
2017/07/05 jQuery
JS实现页面打印(整体、局部)
2017/08/18 Javascript
JavaScript requestAnimationFrame动画详解
2017/09/14 Javascript
用Axios Element实现全局的请求loading的方法
2018/03/15 Javascript
vue自定义filters过滤器
2018/04/26 Javascript
node.js利用socket.io实现多人在线匹配联机五子棋
2018/05/31 Javascript
[04:22]DOTA2上海特级锦标赛主赛事第四日TOP10
2016/03/06 DOTA
[04:54]DOTA2 2017国际邀请赛:上届冠军WINGS采访短片
2017/08/09 DOTA
Python中用post、get方式提交数据的方法示例
2017/09/22 Python
python MysqlDb模块安装及其使用详解
2018/02/23 Python
win7 x64系统中安装Scrapy的方法
2018/11/18 Python
python求加权平均值的实例(附纯python写法)
2019/08/22 Python
Django框架models使用group by详解
2020/03/11 Python
keras自定义损失函数并且模型加载的写法介绍
2020/06/15 Python
前端canvas水印快速制作(附完整代码)
2019/09/19 HTML / CSS
工程造价专业大专生求职信
2013/10/06 职场文书
建筑专业自荐信
2013/10/18 职场文书
外语系毕业生自荐信范文
2013/12/16 职场文书
办公室文员工作职责
2014/01/31 职场文书
学生周末回家住宿长期请假条
2014/02/15 职场文书
演讲稿开场白台词
2014/08/25 职场文书
计算机科学与技术专业求职信
2014/09/03 职场文书
工作证明范本(2篇)
2014/09/14 职场文书
离婚协议书范本(通用篇)
2014/11/30 职场文书
2015年调度员工作总结
2015/04/30 职场文书
贫民窟的百万富翁观后感
2015/06/09 职场文书
幼儿园托班开学寄语(2016秋季)
2015/12/03 职场文书
解决tk mapper 通用mapper的bug问题
2021/06/16 Java/Android
Python first-order-model实现让照片动起来
2022/06/25 Python