Python数据预处理之数据规范化(归一化)示例


Posted in Python onJanuary 08, 2019

本文实例讲述了Python数据预处理之数据规范化。分享给大家供大家参考,具体如下:

数据规范化

为了消除指标之间的量纲和取值范围差异的影响,需要进行标准化(归一化)处理,将数据按照比例进行缩放,使之落入一个特定的区域,便于进行综合分析。

数据规范化方法主要有:

- 最小-最大规范化
- 零-均值规范化

数据示例

Python数据预处理之数据规范化(归一化)示例

代码实现

#-*- coding: utf-8 -*-
#数据规范化
import pandas as pd
import numpy as np
datafile = 'normalization_data.xls' #参数初始化
data = pd.read_excel(datafile, header = None) #读取数据
(data - data.min())/(data.max() - data.min()) #最小-最大规范化
(data - data.mean())/data.std() #零-均值规范化

从命令行可以看到下面的输出:

>>> (data-data.min())/(data.max()-data.min(
          0         1         2         3
0  0.074380  0.937291  0.923520  1.000000
1  0.619835  0.000000  0.000000  0.850941
2  0.214876  0.119565  0.813322  0.000000
3  0.000000  1.000000  1.000000  0.563676
4  1.000000  0.942308  0.996711  0.804149
5  0.264463  0.838629  0.814967  0.909310
6  0.636364  0.846990  0.786184  0.929571

>>> (data-data.mean())/data.std()
          0         1         2         3
0 -0.905383  0.635863  0.464531  0.798149
1  0.604678 -1.587675 -2.193167  0.369390
2 -0.516428 -1.304030  0.147406 -2.078279
3 -1.111301  0.784628  0.684625 -0.456906
4  1.657146  0.647765  0.675159  0.234796
5 -0.379150  0.401807  0.152139  0.537286
6  0.650438  0.421642  0.069308  0.595564

上述代码改为使用print语句打印,如下:

#-*- coding: utf-8 -*-
#数据规范化
import pandas as pd
import numpy as np
datafile = 'normalization_data.xls' #参数初始化
data = pd.read_excel(datafile, header = None) #读取数据
print((data - data.min())/(data.max() - data.min())) #最小-最大规范化
print((data - data.mean())/data.std()) #零-均值规范化

可输出如下打印结果:

          0         1         2         3
0  0.074380  0.937291  0.923520  1.000000
1  0.619835  0.000000  0.000000  0.850941
2  0.214876  0.119565  0.813322  0.000000
3  0.000000  1.000000  1.000000  0.563676
4  1.000000  0.942308  0.996711  0.804149
5  0.264463  0.838629  0.814967  0.909310
6  0.636364  0.846990  0.786184  0.929571
          0         1         2         3
0 -0.905383  0.635863  0.464531  0.798149
1  0.604678 -1.587675 -2.193167  0.369390
2 -0.516428 -1.304030  0.147406 -2.078279
3 -1.111301  0.784628  0.684625 -0.456906
4  1.657146  0.647765  0.675159  0.234796
5 -0.379150  0.401807  0.152139  0.537286
6  0.650438  0.421642  0.069308  0.595564

附:代码中使用到的normalization_data.xls点击此处本站下载

希望本文所述对大家Python程序设计有所帮助。

Python 相关文章推荐
实例讲解Python中函数的调用与定义
Mar 14 Python
神经网络python源码分享
Dec 15 Python
python编写弹球游戏的实现代码
Mar 12 Python
Python实现购物车程序
Apr 16 Python
python3+PyQt5泛型委托详解
Apr 24 Python
pycharm下查看python的变量类型和变量内容的方法
Jun 26 Python
pytorch permute维度转换方法
Dec 14 Python
Python爬虫 scrapy框架爬取某招聘网存入mongodb解析
Jul 31 Python
基于Python实现船舶的MMSI的获取(推荐)
Oct 21 Python
python GUI库图形界面开发之PyQt5表格控件QTableView详细使用方法与实例
Mar 01 Python
Python基于unittest实现测试用例执行
Nov 25 Python
Python常用配置文件ini、json、yaml读写总结
Jul 09 Python
Python实现的拉格朗日插值法示例
Jan 08 #Python
Python3 安装PyQt5及exe打包图文教程
Jan 08 #Python
在python3中pyqt5和mayavi不兼容问题的解决方法
Jan 08 #Python
Django之模型层多表操作的实现
Jan 08 #Python
对python mayavi三维绘图的实现详解
Jan 08 #Python
利用python和ffmpeg 批量将其他图片转换为.yuv格式的方法
Jan 08 #Python
python+opencv打开摄像头,保存视频、拍照功能的实现方法
Jan 08 #Python
You might like
php时区转换转换函数
2014/01/07 PHP
Paypal实现循环扣款(订阅)功能
2017/03/23 PHP
实例讲解PHP验证邮箱是否合格
2019/01/28 PHP
jquery 分页控件实现代码
2009/11/30 Javascript
JavaScript几种形式的树结构菜单
2010/05/10 Javascript
提高javascript效率 一次判断,而不要次次判断
2012/03/30 Javascript
JS返回上一页实例代码通过图片和按钮分别实现
2013/08/16 Javascript
jquery网页回到顶部效果(图标渐隐,自写)
2014/06/16 Javascript
JS实现先显示大图后自动收起显示小图的广告代码
2015/09/04 Javascript
辨析JavaScript中的Undefined类型与null类型
2016/05/26 Javascript
Vuejs仿网易云音乐实现听歌及搜索功能
2017/03/30 Javascript
详解在Vue中使用TypeScript的一些思考(实践)
2018/07/06 Javascript
JavaScript变量提升和严格模式实例分析
2019/01/27 Javascript
vue项目打包上传github并制作预览链接(pages)
2019/04/19 Javascript
Vue路由模块化配置的完整步骤
2019/08/14 Javascript
解决layui table表单提示数据接口请求异常的问题
2019/09/24 Javascript
微信小程序自定义模态弹窗组件详解
2019/12/24 Javascript
[04:50]DOTA2亚洲邀请赛小组赛第四日 TOP10精彩集锦
2015/02/02 DOTA
Python函数中定义参数的四种方式
2014/11/30 Python
python使用wxPython打开并播放wav文件的方法
2015/04/24 Python
Python探索之Metaclass初步了解
2017/10/28 Python
Python读取stdin方法实例
2019/05/24 Python
Python编写通讯录通过数据库存储实现模糊查询功能
2019/07/18 Python
Django2 连接MySQL及model测试实例分析
2019/12/10 Python
利用Python自动化操作AutoCAD的实现
2020/04/01 Python
Python 实现二叉查找树的示例代码
2020/12/21 Python
详解Canvas实用库Fabric.js使用手册
2019/01/07 HTML / CSS
一家专门经营包包的英国网站:MyBag
2019/09/08 全球购物
linux面试相关问题
2012/08/11 面试题
环境科学毕业生自荐信
2013/11/21 职场文书
大学生职业生涯规划范文
2014/01/22 职场文书
中职生自荐信范文
2014/06/15 职场文书
2014年妇幼卫生工作总结
2014/12/09 职场文书
golang 语言中错误处理机制
2021/08/30 Golang
springboot+zookeeper实现分布式锁
2022/03/21 Java/Android
Springboot集成kafka高级应用实战分享
2022/08/14 Java/Android