编程 Python

TensorFlow实现批量归一化操作的示例

Posted in Python onApril 22, 2020

批量归一化

在对神经网络的优化方法中，有一种使用十分广泛的方法——批量归一化，使得神经网络的识别准确度得到了极大的提升。

在网络的前向计算过程中，当输出的数据不再同一分布时，可能会使得loss的值非常大，使得网络无法进行计算。产生梯度爆炸的原因是因为网络的内部协变量转移，即正向传播的不同层参数会将反向训练计算时参照的数据样本分布改变。批量归一化的目的，就是要最大限度地保证每次的正向传播输出在同一分布上，这样反向计算时参照的数据样本分布就会与正向计算时的数据分布一样了，保证分布的统一。

了解了原理，批量正则化的做法就会变得简单，即将每一层运算出来的数据都归一化成均值为0方差为1的标准高斯分布。这样就会在保留样本分布特征的同时，又消除层与层间的分布差异。在实际的应用中，批量归一化的收敛非常快，并且有很强的泛化能力，在一些情况下，完全可以代替前面的正则化，dropout。

批量归一化的定义

在TensorFlow中有自带的BN函数定义：

tf.nn.batch_normalization(x,
             maen,
             variance,
             offset,
             scale,
             variance_epsilon)

各个参数的含义如下：

x：代表输入

mean：代表样本的均值

variance：代表方差

offset：代表偏移量，即相加一个转化值，通常是用激活函数来做。

scale：代表缩放，即乘以一个转化值，同理，一般是1

variance_epsilon：为了避免分母是0的情况，给分母加一个极小值。

要使用这个函数，还需要另外的一个函数的配合：tf.nn.moments()，由此函数来计算均值和方差，然后就可以使用BN了，给函数的定义如下：

tf.nn.moments(x, axes, name, keep_dims=False)，axes指定那个轴求均值和方差。

为了更好的效果，我们使用平滑指数衰减的方法来优化每次的均值和方差，这里可以使用

tf.train.ExponentialMovingAverage()函数，它的作用是让上一次的值对本次的值有一个衰减后的影响，从而使的每次的值连起来后会相对平滑一下。

批量归一化的简单用法

下面介绍具体的用法，在使用的时候需要引入头文件。

from tensorflow.contrib.layers.python.layers import batch_norm

函数的定义如下：

batch_norm(inputs,
      decay,
      center,
      scale,
      epsilon,
      activation_fn,
      param_initializers=None,
      param_regularizers=None,
      updates_collections=ops.GraphKeys.UPDATE_OPS,
      is_training=True,
      reuse=None,
      variables_collections=None,
      outputs_collections=None,
      trainable=True,
      batch_weights=None,
      fused=False,
      data_format=DATA_FORMAT_NHWC,
      zero_debias_moving_mean=False,
      scope=None,
      renorm=False,
      renorm_clipping=None,
      renorm_decay=0.99)

各参数的具体含义如下：

inputs：输入

decay：移动平均值的衰减速度，使用的是平滑指数衰减的方法更新均值方差，一般会设置0.9，值太小会导致更新太快，值太大会导致几乎没有衰减，容易出现过拟合。

scale：是否进行变换，通过乘以一个gamma值进行缩放，我们常习惯在BN后面接一个线性变化，如relu。

epsilon：为了避免分母为0，给分母加上一个极小值，一般默认。

is_training：当为True时，代表训练过程，这时会不断更新样本集的均值和方差，当测试时，要设置为False，这样就会使用训练样本的均值和方差。

updates_collections：在训练时，提供一种内置的均值方差更新机制，即通过图中的tf.GraphKeys.UPDATE_OPS变量来更新。但它是在每次当前批次训练完成后才更新均值和方差，这样导致当前数据总是使用前一次的均值和方差，没有得到最新的值，所以一般设置为None，让均值和方差及时更新，但在性能上稍慢。

reuse：支持变量共享。

具体的代码如下：

x = tf.placeholder(dtype=tf.float32, shape=[None, 32, 32, 3])
y = tf.placeholder(dtype=tf.float32, shape=[None, 10])
train = tf.Variable(tf.constant(False))

x_images = tf.reshape(x, [-1, 32, 32, 3])


def batch_norm_layer(value, train=False, name='batch_norm'):
  if train is not False:
    return batch_norm(value, decay=0.9, updates_collections=None, is_training=True)
  else:
    return batch_norm(value, decay=0.9, updates_collections=None, is_training=False)


w_conv1 = init_cnn.weight_variable([3, 3, 3, 64]) # [-1, 32, 32, 3]
b_conv1 = init_cnn.bias_variable([64])
h_conv1 = tf.nn.relu(batch_norm_layer((init_cnn.conv2d(x_images, w_conv1) + b_conv1), train))
h_pool1 = init_cnn.max_pool_2x2(h_conv1)


w_conv2 = init_cnn.weight_variable([3, 3, 64, 64]) # [-1, 16, 16, 64]
b_conv2 = init_cnn.bias_variable([64])
h_conv2 = tf.nn.relu(batch_norm_layer((init_cnn.conv2d(h_pool1, w_conv2) + b_conv2), train))
h_pool2 = init_cnn.max_pool_2x2(h_conv2)


w_conv3 = init_cnn.weight_variable([3, 3, 64, 32]) # [-1, 18, 8, 32]
b_conv3 = init_cnn.bias_variable([32])
h_conv3 = tf.nn.relu(batch_norm_layer((init_cnn.conv2d(h_pool2, w_conv3) + b_conv3), train))
h_pool3 = init_cnn.max_pool_2x2(h_conv3)

w_conv4 = init_cnn.weight_variable([3, 3, 32, 16]) # [-1, 18, 8, 32]
b_conv4 = init_cnn.bias_variable([16])
h_conv4 = tf.nn.relu(batch_norm_layer((init_cnn.conv2d(h_pool3, w_conv4) + b_conv4), train))
h_pool4 = init_cnn.max_pool_2x2(h_conv4)


w_conv5 = init_cnn.weight_variable([3, 3, 16, 10]) # [-1, 4, 4, 16]
b_conv5 = init_cnn.bias_variable([10])
h_conv5 = tf.nn.relu(batch_norm_layer((init_cnn.conv2d(h_pool4, w_conv5) + b_conv5), train))
h_pool5 = init_cnn.avg_pool_4x4(h_conv5)         # [-1, 4, 4, 10]

y_pool = tf.reshape(h_pool5, shape=[-1, 10])


cross_entropy = tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits(labels=y, logits=y_pool))

optimizer = tf.train.AdamOptimizer(learning_rate).minimize(cross_entropy)

加上了BN层之后，识别的准确率显著的得到了提升，并且计算速度也是飞起。

到此这篇关于TensorFlow实现批量归一化操作的示例的文章就介绍到这了,更多相关TensorFlow 批量归一化操作内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木！

TensorFlow实现批量归一化操作的示例

- Author -

Baby-Lily

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

python定时执行指定函数的方法

May 27 Python

Python使用当前时间、随机数产生一个唯一数字的方法

Sep 18 Python

python编写暴力破解zip文档程序的实例讲解

Apr 24 Python

Python读取excel中的图片完美解决方法

Jul 27 Python

Python 实现文件打包、上传与校验的方法

Feb 13 Python

Python实现基于SVM的分类器的方法

Jul 19 Python

python3.8 微信发送服务器监控报警消息代码实现

Nov 05 Python

python序列化与数据持久化实例详解

Dec 20 Python

python通过opencv实现图片裁剪原理解析

Jan 19 Python

java关于string最常出现的面试题整理

Jan 18 Python

正确的理解和使用Django信号(Signals)

Apr 14 Python

python 如何将两个实数矩阵合并为一个复数矩阵

May 19 Python

三步解决python PermissionError: [WinError 5]拒绝访问的情况

Apr 22 #Python

python实现四人制扑克牌游戏

Apr 22 #Python

如何在django中实现分页功能

Apr 22 #Python

在Windows上安装和配置 Jupyter Lab 作为桌面级应用程序教程

Apr 22 #Python

python实现扑克牌交互式界面发牌程序

Apr 22 #Python

文件上传服务器-jupyter 中python解压及压缩方式

Apr 22 #Python

如何将tensorflow训练好的模型移植到Android (MNIST手写数字识别)

Apr 22 #Python

You might like

PHP函数addslashes和mysql_real_escape_string的区别

2014/04/22 PHP

PHP查询快递信息的方法

2015/03/07 PHP

PHP测试成功的邮件发送案例

2015/10/26 PHP

PHP call_user_func和call_user_func_array函数的简单理解与应用分析

2019/11/25 PHP

基于PHP实现用户登录注册功能的详细教程

2020/08/04 PHP

TP - 比RBAC更好的权限认证方式（Auth类认证）

2021/03/09 PHP

发现的以前不知道的函数

2006/09/19 Javascript

jQuery实现注册时选择阅读条款左右移动

2013/04/11 Javascript

JS Replace 全部替换字符的用法小结

2013/12/24 Javascript

如何调试异步加载页面里包含的js文件

2014/10/30 Javascript

js实现从数组里随机获取元素

2015/01/12 Javascript

JavaScript控制table某列不显示的方法

2015/03/16 Javascript

jQuery实现的手机发送验证码倒计时效果代码分享

2015/08/24 Javascript

jquery图片轮播特效代码分享

2020/04/20 Javascript

javascript图片预加载完整实例

2015/12/10 Javascript

javascript和jquery实现用户登录验证

2016/05/04 Javascript

通用无限极下拉菜单的实现代码

2016/05/31 Javascript

JavaScript浏览器对象模型BOM(BrowserObjectModel)实例详解

2016/11/29 Javascript

js图片轮播手动切换特效

2017/01/12 Javascript

浅谈Vue的加载顺序探讨

2017/10/25 Javascript

vue中实现左右联动的效果

2018/06/22 Javascript

Electron 如何调用本地模块的方法

2019/02/01 Javascript

在Vue中创建可重用的 Transition的方法

2020/06/02 Javascript

微信小程序实现左滑删除效果

2020/11/18 Javascript

[12:29]2018国际邀请赛开幕秀

2018/08/22 DOTA

Python中使用PIL库实现图片高斯模糊实例

2015/02/08 Python

python实现网站的模拟登录

2016/01/04 Python

Python数据预处理之数据规范化（归一化）示例

2019/01/08 Python

使用Python爬取Json数据的示例代码

2020/12/07 Python

python爬取代理ip的示例

2020/12/18 Python

Skyscanner英国：苏格兰的全球三大领先航班搜索服务之一

2017/11/09 全球购物

精致的手工皮鞋：Shoe Embassy

2019/11/08 全球购物

获奖的大学生创业计划书

2014/01/05 职场文书

服装设计专业自荐信

2014/06/17 职场文书

2015年工会工作总结范文

2015/07/23 职场文书

bootstrapv4轮播图去除两侧阴影及线框的方法

2022/02/15 HTML / CSS