编程 Python

踩坑:pytorch中eval模式下结果远差于train模式介绍

Posted in Python onJune 23, 2020

首先，eval模式和train模式得到不同的结果是正常的。我的模型中，eval模式和train模式不同之处在于Batch Normalization和Dropout。Dropout比较简单，在train时会丢弃一部分连接，在eval时则不会。Batch Normalization，在train时不仅使用了当前batch的均值和方差，也使用了历史batch统计上的均值和方差，并做一个加权平均（momentum参数）。在test时，由于此时batchsize不一定一致，因此不再使用当前batch的均值和方差，仅使用历史训练时的统计值。

我出bug的现象是，train模式下可以收敛，但一旦在测试中切换到了eval模式，结果就很差。如果在测试中仍沿用train模式，反而可以得到不错的结果。为了确保是程序bug而不是算法本身就不适合于预测，我在测试时再次使用了训练集，正常情况下此时应发生过拟合，正确率一定会很高，然而eval模式下正确率仍然很低。参照网上的一些说法（Performance highly degraded when eval() is activated in the test phase
），我调大了batchsize，降低了BN层的momentum，检查了是否存在不同层使用相同BN层的bug，均不见效。有一种方法说应在BN层设置track_running_stats为False，它虽然带来了好的效果，但实际上它只不过是不用eval模式，切回train模式罢了，所以也不对。

学习了在训练过程中，如何将BN层中统计的均值和方差输出。即在forward()中，

# bn是一个BN层，torch.nn.batch_normalization(...)
print(bn.running_mean)
print(bn.running_var)

同时学习了如何输出一个Tensor自身的均值和方差，即

# x是一个Tensor，dims是需要计算的维度
print(x.cpu().detach().numpy().mean(dims)
print(x.cpu().detach().numpy().var(dims)

观察每一层的输出结果，发现出现了很大的方差，才猛然意识到自己的输入数据没有做归一化（事后想想也确实如此，毕竟模型和训练方法都是github上参考别人的，出错概率很小；反而是自己写的DataSet部分，其实是最容易出错的）。给模型加上归一化后，eval和train的结果就没有问题了。

再次验证了我的观点：越是玄学的问题，越是傻逼的bug。

补充知识：Pytorch中的train和eval用法注意点

1.介绍

一般情况，model.train()是在训练的时候用到，model.eval()是在测试的时候用到

2.用法

如果模型中没有类似于BN这样的归一化或者Dropout，model.train()和model.eval()可以不要（建议写一下，比较安全），并且model.train()和model.eval()得到的效果是一样

如果模型中有类似于BN这样的归一化或者Dropout，并且程序需要边训练和边测试，最好就是用model.eval()测试完之后，后面补一个model.train()。

其中model.train()是保证BN用每一批数据的均值和方差，而model.eval()是保证BN用全部训练数据的均值和方差；而对于Dropout，model.train()是随机取一部分网络连接来训练更新参数，而model.eval()是利用到了所有网络连接（结果是取了平均）

以上这篇踩坑:pytorch中eval模式下结果远差于train模式介绍就是小编分享给大家的全部内容了，希望能给大家一个参考，也希望大家多多支持三水点靠木。

踩坑:pytorch中eval模式下结果远差于train模式介绍

- Author -

yucong96

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

python实现linux服务器批量修改密码并生成execl

Apr 22 Python

Python实现TCP协议下的端口映射功能的脚本程序示例

Jun 14 Python

Python实现将一个正整数分解质因数的方法分析

Dec 14 Python

python的concat等多种用法详解

Nov 28 Python

对python制作自己的数据集实例讲解

Dec 12 Python

Python遍历文件夹处理json文件的方法

Jan 22 Python

Pytoch之torchvision.transforms图像变换实例

Dec 30 Python

基于Python数据结构之递归与回溯搜索

Feb 26 Python

Keras搭建自编码器操作

Jul 03 Python

Python如何定义接口和抽象类

Jul 28 Python

一起来学习Python的元组和列表

Mar 13 Python

如何使用python包中的sched事件调度器

Apr 30 Python

pytorch掉坑记录:model.eval的作用说明

Jun 23 #Python

Python使用Selenium实现淘宝抢单的流程分析

Jun 23 #Python

python2和python3哪个使用率高

Jun 23 #Python

python使用QQ邮箱实现自动发送邮件

Jun 22 #Python

浅谈keras中loss与val_loss的关系

Jun 22 #Python

python实现简易版学生成绩管理系统

Jun 22 #Python

python能否java成为主流语言吗

Jun 22 #Python

You might like

PHP 学习路线与时间表

2010/02/21 PHP

linux下安装php的memcached客户端

2014/08/03 PHP

从零开始学习jQuery (十一) 实战表单验证与自动完成提示插件

2011/02/23 Javascript

JS构建页面的DOM节点结构的实现代码

2011/12/09 Javascript

jquery选择器-根据多个属性选择示例代码

2013/10/21 Javascript

jquery 判断滚动条到达了底部和顶端的方法

2014/04/02 Javascript

jquery实现图片左右切换的方法

2015/05/07 Javascript

javascript生成大小写字母

2015/07/03 Javascript

基于jQuery倾斜打开侧边栏菜单特效代码

2015/09/15 Javascript

浅析JS动态创建元素【两种方法】

2016/04/20 Javascript

全面了解JavaScript的数据类型转换

2016/07/01 Javascript

全面解析Bootstrap表单样式的使用

2016/09/09 Javascript

jQuery实现ToolTip元素定位显示功能示例

2016/11/23 Javascript

Javascript自定义事件详解

2017/01/13 Javascript

vue项目中应用ueditor自定义上传按钮功能

2018/04/27 Javascript

jquery操作checkbox的常用方法总结【附测试源码下载】

2019/06/10 jQuery

python创建列表并给列表赋初始值的方法

2015/07/28 Python

python实现决策树分类算法

2017/12/21 Python

解决python 输出是省略号的问题

2018/04/19 Python

Python基于dom操作xml数据的方法示例

2018/05/12 Python

详解windows python3.7安装numpy问题的解决方法

2018/08/13 Python

pytorch实现用Resnet提取特征并保存为txt文件的方法

2019/08/20 Python

PYTHON实现SIGN签名的过程解析

2019/10/28 Python

Python爬虫获取豆瓣电影并写入excel

2020/07/31 Python

Scrapy中如何向Spider传入参数的方法实现

2020/09/28 Python

python输出国际象棋棋盘的实例分享

2020/11/26 Python

使用jTopo给Html5 Canva中绘制的元素添加鼠标事件

2014/05/15 HTML / CSS

马德里竞技官方网上商店：Atletico Madrid Shop

2019/03/31 全球购物

德国Discount-Apotheke中文官网：DC德式康线上药房

2020/02/18 全球购物

Yahoo的PHP面试题

2014/05/26 面试题

值传递还是引用传递

2015/02/08 面试题

大专应届生个人的自我评价

2013/11/21 职场文书

执行力心得体会

2013/12/31 职场文书

青年志愿者事迹材料

2014/02/07 职场文书

小学大队长竞选稿

2015/11/20 职场文书

TensorFlow中tf.batch_matmul()的用法

2021/06/02 Python