Python数据预处理之数据规范化(归一化)示例


Posted in Python onJanuary 08, 2019

本文实例讲述了Python数据预处理之数据规范化。分享给大家供大家参考,具体如下:

数据规范化

为了消除指标之间的量纲和取值范围差异的影响,需要进行标准化(归一化)处理,将数据按照比例进行缩放,使之落入一个特定的区域,便于进行综合分析。

数据规范化方法主要有:

- 最小-最大规范化
- 零-均值规范化

数据示例

Python数据预处理之数据规范化(归一化)示例

代码实现

#-*- coding: utf-8 -*-
#数据规范化
import pandas as pd
import numpy as np
datafile = 'normalization_data.xls' #参数初始化
data = pd.read_excel(datafile, header = None) #读取数据
(data - data.min())/(data.max() - data.min()) #最小-最大规范化
(data - data.mean())/data.std() #零-均值规范化

从命令行可以看到下面的输出:

>>> (data-data.min())/(data.max()-data.min(
          0         1         2         3
0  0.074380  0.937291  0.923520  1.000000
1  0.619835  0.000000  0.000000  0.850941
2  0.214876  0.119565  0.813322  0.000000
3  0.000000  1.000000  1.000000  0.563676
4  1.000000  0.942308  0.996711  0.804149
5  0.264463  0.838629  0.814967  0.909310
6  0.636364  0.846990  0.786184  0.929571

>>> (data-data.mean())/data.std()
          0         1         2         3
0 -0.905383  0.635863  0.464531  0.798149
1  0.604678 -1.587675 -2.193167  0.369390
2 -0.516428 -1.304030  0.147406 -2.078279
3 -1.111301  0.784628  0.684625 -0.456906
4  1.657146  0.647765  0.675159  0.234796
5 -0.379150  0.401807  0.152139  0.537286
6  0.650438  0.421642  0.069308  0.595564

上述代码改为使用print语句打印,如下:

#-*- coding: utf-8 -*-
#数据规范化
import pandas as pd
import numpy as np
datafile = 'normalization_data.xls' #参数初始化
data = pd.read_excel(datafile, header = None) #读取数据
print((data - data.min())/(data.max() - data.min())) #最小-最大规范化
print((data - data.mean())/data.std()) #零-均值规范化

可输出如下打印结果:

          0         1         2         3
0  0.074380  0.937291  0.923520  1.000000
1  0.619835  0.000000  0.000000  0.850941
2  0.214876  0.119565  0.813322  0.000000
3  0.000000  1.000000  1.000000  0.563676
4  1.000000  0.942308  0.996711  0.804149
5  0.264463  0.838629  0.814967  0.909310
6  0.636364  0.846990  0.786184  0.929571
          0         1         2         3
0 -0.905383  0.635863  0.464531  0.798149
1  0.604678 -1.587675 -2.193167  0.369390
2 -0.516428 -1.304030  0.147406 -2.078279
3 -1.111301  0.784628  0.684625 -0.456906
4  1.657146  0.647765  0.675159  0.234796
5 -0.379150  0.401807  0.152139  0.537286
6  0.650438  0.421642  0.069308  0.595564

附:代码中使用到的normalization_data.xls点击此处本站下载

希望本文所述对大家Python程序设计有所帮助。

Python 相关文章推荐
python字符串过滤性能比较5种方法
Jun 22 Python
详解Django rest_framework实现RESTful API
May 24 Python
浅谈Django的缓存机制
Aug 23 Python
便捷提取python导入包的属性方法
Oct 15 Python
Python字典的核心底层原理讲解
Jan 24 Python
使用Python进行体育竞技分析(预测球队成绩)
May 16 Python
用Python实现最速下降法求极值的方法
Jul 10 Python
处理python中多线程与多进程中的数据共享问题
Jul 28 Python
python图形开发GUI库pyqt5的基本使用方法详解
Feb 14 Python
python实现企业微信定时发送文本消息的实例代码
Nov 25 Python
两行代码解决Jupyter Notebook中文不能显示的问题
Apr 24 Python
python scipy 稀疏矩阵的使用说明
May 26 Python
Python实现的拉格朗日插值法示例
Jan 08 #Python
Python3 安装PyQt5及exe打包图文教程
Jan 08 #Python
在python3中pyqt5和mayavi不兼容问题的解决方法
Jan 08 #Python
Django之模型层多表操作的实现
Jan 08 #Python
对python mayavi三维绘图的实现详解
Jan 08 #Python
利用python和ffmpeg 批量将其他图片转换为.yuv格式的方法
Jan 08 #Python
python+opencv打开摄像头,保存视频、拍照功能的实现方法
Jan 08 #Python
You might like
漫荒推荐:画风超赞的国风漫画推荐 超长假期不无聊
2020/03/08 国漫
基于php常用函数总结(数组,字符串,时间,文件操作)
2013/06/27 PHP
php在数组中查找指定值的方法
2015/03/17 PHP
搜索附近的人PHP实现代码
2018/02/11 PHP
PHP使用SMTP邮件服务器发送邮件示例
2018/08/28 PHP
如何优雅的使用 laravel 的 validator验证方法
2018/11/11 PHP
键盘KeyCode值列表汇总
2013/11/26 Javascript
Jquery实现控件的隐藏和显示实例
2014/02/08 Javascript
Javascript模块化编程详解
2014/12/01 Javascript
js全选实现和判断是否有复选框选中的方法
2015/02/17 Javascript
EasyUI实现二级页面的内容勾选的方法
2015/03/01 Javascript
jQuery实现在最后一个元素之前插入新元素的方法
2015/07/18 Javascript
javascript实现多栏闭合展开式广告位菜单效果实例
2015/08/05 Javascript
动态加载css方法实现和深入解析
2017/01/18 Javascript
深入学习nodejs中的async模块的使用方法
2017/07/12 NodeJs
在小程序中使用腾讯视频插件播放教程视频的方法
2018/07/10 Javascript
详解JavaScript中的数据类型,以及检测数据类型的方法
2020/09/17 Javascript
微信小程序自定义modal弹窗组件的方法详解
2020/12/20 Javascript
[15:23]教你分分钟做大人:虚空假面
2014/10/30 DOTA
[00:17]DOTA2荣耀之路5:It’s a disastah!
2018/05/28 DOTA
python结合opencv实现人脸检测与跟踪
2015/06/08 Python
python实战串口助手_解决8串口多个发送的问题
2019/06/12 Python
python中PS 图像调整算法原理之亮度调整
2019/06/28 Python
关于阿里云oss获取sts凭证 app直传 python的实例
2019/08/20 Python
Django自带日志 settings.py文件配置方法
2019/08/30 Python
python 代码运行时间获取方式详解
2020/09/18 Python
Python基于爬虫实现全网搜索并下载音乐
2021/02/14 Python
利用HTML5的新特点实现图片文件异步上传
2014/05/29 HTML / CSS
全陪导游欢迎词
2014/01/17 职场文书
新法人代表任命书
2014/06/06 职场文书
小学爱国卫生月活动总结
2014/06/30 职场文书
列车乘务员工作不细心检讨书
2014/10/07 职场文书
故意伤害人身损害赔偿协议书
2014/11/19 职场文书
2015年学校综合治理工作总结
2015/07/20 职场文书
Mysql数据库索引面试题(程序员基础技能)
2021/05/31 MySQL
MySQL定时备份数据库(全库备份)的实现
2021/09/25 MySQL