编程 Python

Pytorch 中net.train 和 net.eval的使用说明

Posted in Python onMay 22, 2021

在训练模型时会在前面加上：

model.train()

在测试模型时在前面使用：

model.eval()

同时发现，如果不写这两个程序也可以运行，这是因为这两个方法是针对在网络训练和测试时采用不同方式的情况，比如Batch Normalization 和 Dropout。

训练时是正对每个min-batch的，但是在测试中往往是针对单张图片，即不存在min-batch的概念。

由于网络训练完毕后参数都是固定的，因此每个批次的均值和方差都是不变的，因此直接结算所有batch的均值和方差。

所有Batch Normalization的训练和测试时的操作不同

在训练中，每个隐层的神经元先乘概率P，然后在进行激活，在测试中，所有的神经元先进行激活，然后每个隐层神经元的输出乘P。

补充：Pytorch踩坑记录——model.eval()

最近在写代码时遇到一个问题，原本训练好的模型，加载进来进行inference准确率直接掉了5个点，尼玛，这简直不能忍啊～本菜鸡下意识地感知到我肯定又在哪里写了bug了～～～于是开始到处排查，从model load到data load，最终在一个被我封装好的module的犄角旮旯里找到了问题，于是顺便就在这里总结一下，避免以后再犯。

对于训练好的模型加载进来准确率和原先的不符，比较常见的有两方面的原因：

1）data

2）model.state_dict()

1） data

数据方面，检查前后两次加载的data有没有发生变化。首先检查 transforms.Normalize 使用的均值和方差是否和训练时相同；另外检查在这个过程中数据是否经过了存储形式的改变，这有可能会带来数据精度的变化导致一定的信息丢失。

比如我过用的其中一个数据集，原先将图片存储成向量形式，但其对应的是“png”格式的数据（后来在原始文件中发现了相应的描述。），而我进行了一次data-to-img操作，将向量转换成了“jpg”形式，这时加载进来便造成了掉点。

2）model.state_dict()

第一方面造成的掉点一般不会太严重，第二方面造成的掉点就比较严重了，一旦模型的参数加载错了，那就误差大了。

如果是参数没有正确加载进来则比较容易发现，这时准确率非常低，几乎等于瞎猜。

而我这次遇到的情况是，准确率并不是特别低，只掉了几个点，检查了多次，均显示模型参数已经成功加载了。后来仔细查看后发现在其中一次调用模型进行inference时，忘了写 ‘model.eval()'，造成了模型的参数发生变化，再次调用则出现了掉点。

于是又回顾了一下model.eval()和model.train()的具体作用。如下：

model.train() 和 model.eval() 一般在模型训练和评价的时候会加上这两句，主要是针对由于model 在训练时和评价时 Batch

Normalization 和 Dropout 方法模式不同：

a) model.eval()，不启用 BatchNormalization 和 Dropout。此时pytorch会自动把BN和DropOut固定住，不会取平均，而是用训练好的值。不然的话，一旦test的batch_size过小，很容易就会因BN层导致模型performance损失较大；

b) model.train() ：启用 BatchNormalization 和 Dropout。在模型测试阶段使用model.train() 让model变成训练模式，此时 dropout和batch normalization的操作在训练q起到防止网络过拟合的问题。

因此，在使用PyTorch进行训练和测试时一定要记得把实例化的model指定train/eval。

model.eval()   vs   torch.no_grad()

虽然二者都是eval的时候使用，但其作用并不相同:

model.eval() 负责改变batchnorm、dropout的工作方式，如在eval()模式下，dropout是不工作的。见下方代码：

import torch
  import torch.nn as nn
 
  drop = nn.Dropout()
  x = torch.ones(10)
  
  # Train mode   
  drop.train()
  print(drop(x)) # tensor([2., 2., 0., 2., 2., 2., 2., 0., 0., 2.])   
  
  # Eval mode   
  drop.eval()
  print(drop(x)) # tensor([1., 1., 1., 1., 1., 1., 1., 1., 1., 1.])

torch.no_grad() 负责关掉梯度计算，节省eval的时间。

只进行inference时，model.eval()是必须使用的，否则会影响结果准确性。而torch.no_grad()并不是强制的，只影响运行效率。

以上为个人经验，希望能给大家一个参考，也希望大家多多支持三水点靠木。

Pytorch 中net.train 和 net.eval的使用说明

- Author -

Never-Giveup

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

python实现批量监控网站

Sep 09 Python

Python 详解基本语法_函数_返回值

Jan 22 Python

ubuntu安装sublime3并配置python3环境的方法

Mar 15 Python

Python读取txt某几列绘图的方法

Oct 14 Python

pandas 条件搜索返回列表的方法

Oct 30 Python

python3实现名片管理系统

Nov 29 Python

详解opencv Python特征检测及K-最近邻匹配

Jan 21 Python

mac系统下Redis安装和使用步骤详解

Jul 09 Python

Django 权限认证(根据不同的用户，设置不同的显示和访问权限)

Jul 24 Python

Python调用百度OCR实现图片文字识别的示例代码

Jul 17 Python

python中字符串的编码与解码详析

Dec 03 Python

Python爬虫之爬取某文库文档数据

Apr 21 Python

对PyTorch中inplace字段的全面理解

May 22 #Python

pytorch中F.avg_pool1d()和F.avg_pool2d()的使用操作

May 22 #Python

用python实现监控视频人数统计

Python基础之进程详解

如何在C++中调用Python

May 21 #Python

python 定义函数返回值只取其中一个的实现

May 21 #Python

Python+Appium实现自动抢微信红包

You might like

php PDO中文乱码解决办法

2009/07/20 PHP

PHP 向右侧拉菜单实现代码，测试使用中

2009/11/03 PHP

php的ajax框架xajax入门与试用介绍

2010/12/19 PHP

PHP加密3DES报错 Call to undefined function: mcrypt_module_open() 如何解决

2016/04/17 PHP

PHP进程通信基础之信号量与共享内存通信

2017/02/19 PHP

PHP For循环字母A-Z当超过26个字母时输出AA,AB,AC

2020/02/16 PHP

js中几种去掉字串左右空格的方法

2006/12/25 Javascript

javascript 控制弹出窗口

2007/04/10 Javascript

IE8 浏览器Cookie的处理

2009/01/31 Javascript

JavaScript 字符编码规则

2009/05/04 Javascript

JavaScript实用技巧(一)

2010/08/16 Javascript

jquery插件制作图片走廊 gallery

2012/08/17 Javascript

javascript列表框操作函数集合汇总

2013/11/28 Javascript

浅谈js的setInterval事件

2014/12/05 Javascript

js时钟翻牌效果实现代码分享

2020/07/31 Javascript

详解JavaScript的另类写法

2016/04/11 Javascript

Ionic快速安装教程

2016/06/03 Javascript

利用JS实现数字增长

2016/07/28 Javascript

vuejs实现ready函数加载完之后执行某个函数的方法

2018/08/31 Javascript

JavaScript实现复选框全选和取消全选

2020/11/20 Javascript

[36:37]2014 DOTA2华西杯精英邀请赛5 24 VG VS iG

2014/05/25 DOTA

[01:06:12]VP vs NIP 2019国际邀请赛小组赛 BO2 第一场 8.15

2019/08/17 DOTA

python基础教程之元组操作使用详解

2014/03/25 Python

跟老齐学Python之大话题小函数(2)

2014/10/10 Python

在Python中使用PIL模块对图片进行高斯模糊处理的教程

2015/05/05 Python

python 将数据保存为excel的xls格式(实例讲解)

2018/05/03 Python

华为2019校招笔试题之处理字符串(python版)

2019/06/25 Python

基于python监控程序是否关闭

2020/01/14 Python

如何在python中判断变量的类型

2020/07/29 Python

德国旅游网站：weg.de

2018/06/03 全球购物

Public Desire美国/加拿大：全球性的在线鞋类品牌

2018/12/17 全球购物

HEMA法国：荷兰原创设计

2019/02/21 全球购物

Linux中如何用命令创建目录

2015/01/12 面试题

前处理组长岗位职责

2014/03/01 职场文书

书香家庭事迹材料

2014/05/09 职场文书

大学生简历求职信

2014/06/24 职场文书