浅谈pytorch中的BN层的注意事项


Posted in Python onJune 23, 2020

最近修改一个代码的时候,当使用网络进行推理的时候,发现每次更改测试集的batch size大小竟然会导致推理结果不同,甚至产生错误结果,后来发现在网络中定义了BN层,BN层在训练过程中,会将一个Batch的中的数据转变成正太分布,在推理过程中使用训练过程中的参数对数据进行处理,然而网络并不知道你是在训练还是测试阶段,因此,需要手动的加上,需要在测试和训练阶段使用如下函数。

model.train() or model.eval()

BN类的定义见pytorch中文参考文档

补充知识:关于pytorch中BN层(具体实现)的一些小细节

最近在做目标检测,需要把训好的模型放到嵌入式设备上跑前向,因此得把各种层的实现都用C手撸一遍,,,此为背景。

其他层没什么好说的,但是BN层这有个小坑。pytorch在打印网络参数的时候,只打出weight和bias这两个参数。咦,说好的BN层有四个参数running_mean、running_var 、gamma 、beta的呢?一开始我以为是pytorch把BN层的计算简化成weight * X + bias,但马上反应过来应该没这么简单,因为pytorch中只有可学习的参数才称为parameter。上网找了一些资料但都没有说到这么细的,毕竟大部分用户使用时只要模型能跑起来就行了,,,于是开始看BN层有哪些属性,果然发现了熟悉的running_mean和running_var,原来pytorch的BN层实现并没有不同。这里吐个槽:为啥要把gamma和beta改叫weight、bias啊,很有迷惑性的好不好,,,

扯了这么多,干脆捋一遍pytorch里BN层的具体实现过程,帮自己理清思路,也可以给大家提供参考。再吐槽一下,在网上搜“pytorch bn层”出来的全是关于这一层怎么用的、初始化时要输入哪些参数,没找到一个pytorch中BN层是怎么实现的,,,

众所周知,BN层的输出Y与输入X之间的关系是:Y = (X - running_mean) / sqrt(running_var + eps) * gamma + beta,此不赘言。其中gamma、beta为可学习参数(在pytorch中分别改叫weight和bias),训练时通过反向传播更新;而running_mean、running_var则是在前向时先由X计算出mean和var,再由mean和var以动量momentum来更新running_mean和running_var。所以在训练阶段,running_mean和running_var在每次前向时更新一次;在测试阶段,则通过net.eval()固定该BN层的running_mean和running_var,此时这两个值即为训练阶段最后一次前向时确定的值,并在整个测试阶段保持不变。

以上这篇浅谈pytorch中的BN层的注意事项就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
跟老齐学Python之for循环语句
Oct 02 Python
理解Python中的With语句
Feb 02 Python
发布你的Python模块详解
Sep 15 Python
python利用拉链法实现字典方法示例
Mar 25 Python
Python 存储字符串时节省空间的方法
Apr 23 Python
Python数据类型之List列表实例详解
May 08 Python
Python代码实现http/https代理服务器的脚本
Aug 12 Python
python利用百度云接口实现车牌识别的示例
Feb 21 Python
详解基于Jupyter notebooks采用sklearn库实现多元回归方程编程
Mar 25 Python
django实现更改数据库某个字段以及字段段内数据
Mar 31 Python
Keras:Unet网络实现多类语义分割方式
Jun 11 Python
Scrapy 配置动态代理IP的实现
Sep 28 Python
Python3与fastdfs分布式文件系统如何实现交互
Jun 23 #Python
踩坑:pytorch中eval模式下结果远差于train模式介绍
Jun 23 #Python
pytorch掉坑记录:model.eval的作用说明
Jun 23 #Python
Python使用Selenium实现淘宝抢单的流程分析
Jun 23 #Python
python2和python3哪个使用率高
Jun 23 #Python
python使用QQ邮箱实现自动发送邮件
Jun 22 #Python
浅谈keras中loss与val_loss的关系
Jun 22 #Python
You might like
雄兵连三大错觉:凯莎没了,凉冰阵亡了,华烨觉得自己又行了
2020/04/09 国漫
php self,$this,const,static,->的使用
2009/10/22 PHP
PHP写UltraEdit插件脚本实现方法
2011/12/26 PHP
PHP如何将log信息写入服务器中的log文件
2015/07/29 PHP
PHP和C#可共用的可逆加密算法详解
2015/10/26 PHP
php采用session实现防止页面重复刷新
2015/12/24 PHP
PHP实现支持加盐的图片加密解密
2016/09/09 PHP
php实现的二叉树遍历算法示例
2017/06/15 PHP
PHP设计模式之委托模式定义与用法简单示例
2018/08/13 PHP
asp函数split()对应php函数explode()
2019/02/27 PHP
利用JQuery的load函数动态加载其它页面的内容的实现代码
2010/12/14 Javascript
javascript的原生方法获取数组中的最大(最小)值
2012/12/19 Javascript
js跳转页面方法总结
2014/01/29 Javascript
js读写json文件实例代码
2014/10/21 Javascript
jQuery对象初始化的传参方式
2015/02/26 Javascript
jQuery.prop() 使用详解
2015/07/19 Javascript
JavaScript闭包实例详解
2016/06/03 Javascript
jquery实现全选、不选、反选的两种方法
2016/09/06 Javascript
jquery Banner轮播选项卡
2016/12/26 Javascript
js HTML5 canvas绘制图片的方法
2017/09/08 Javascript
微信小程序实现时间预约功能
2018/11/27 Javascript
Vue 封装防刷新考试倒计时组件的实现
2020/06/05 Javascript
vue 全局封装loading加载教程(全局监听)
2020/11/05 Javascript
[01:02:45]完美世界DOTA2联赛 LBZS vs Forest 第三场 11.07
2020/11/09 DOTA
Python运算符重载详解及实例代码
2017/03/07 Python
Python 查看文件的编码格式方法
2017/12/21 Python
Python中应该使用%还是format来格式化字符串
2018/09/25 Python
python多线程抽象编程模型详解
2019/03/20 Python
使用python处理题库表格并转化为word形式的实现
2020/04/14 Python
python“静态”变量、实例变量与本地变量的声明示例
2020/11/13 Python
经理秘书找工作求职信
2013/12/19 职场文书
创意活动策划书
2014/01/15 职场文书
校长师德师风自我剖析材料
2014/09/29 职场文书
县人大领导班子四风对照检查材料思想汇报
2014/10/09 职场文书
同学聚会通知短信
2015/04/20 职场文书
python基础之文件操作
2021/10/24 Python