pytorch 实现模型不同层设置不同的学习率方式


Posted in Python onJanuary 06, 2020

在目标检测的模型训练中, 我们通常都会有一个特征提取网络backbone, 例如YOLO使用的darknet SSD使用的VGG-16。

为了达到比较好的训练效果, 往往会加载预训练的backbone模型参数, 然后在此基础上训练检测网络, 并对backbone进行微调, 这时候就需要为backbone设置一个较小的lr。

class net(torch.nn.Module):
  def __init__(self):
    super(net, self).__init__()
    # backbone
    self.backbone = ...
    # detect
    self....

在设置optimizer时, 只需要参数分为两个部分, 并分别给定不同的学习率lr。

base_params = list(map(id, net.backbone.parameters()))
logits_params = filter(lambda p: id(p) not in base_params, net.parameters())
params = [
  {"params": logits_params, "lr": config.lr},
  {"params": net.backbone.parameters(), "lr": config.backbone_lr},
]
optimizer = torch.optim.SGD(params, momentum=config.momentum, weight_decay=config.weight_decay)

以上这篇pytorch 实现模型不同层设置不同的学习率方式就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
详解Django框架中的视图级缓存
Jul 23 Python
Python实现k-means算法
Feb 23 Python
python实现自动获取IP并发送到邮箱
Dec 26 Python
关于python下cv.waitKey无响应的原因及解决方法
Jan 10 Python
OpenCV 边缘检测
Jul 10 Python
Python 点击指定位置验证码破解的实现代码
Sep 11 Python
python实现堆排序的实例讲解
Feb 21 Python
python生成任意频率正弦波方式
Feb 25 Python
解决windows下python3使用multiprocessing.Pool出现的问题
Apr 08 Python
PageFactory设计模式基于python实现
Apr 14 Python
matplotlib绘制多子图共享鼠标光标的方法示例
Jan 08 Python
tensorflow2.0教程之Keras快速入门
Feb 20 Python
浅析Python3 pip换源问题
Jan 06 #Python
通过实例学习Python Excel操作
Jan 06 #Python
pytorch载入预训练模型后,实现训练指定层
Jan 06 #Python
python与mysql数据库交互的实现
Jan 06 #Python
win10系统下python3安装及pip换源和使用教程
Jan 06 #Python
基于python实现文件加密功能
Jan 06 #Python
Pytorch 实现冻结指定卷积层的参数
Jan 06 #Python
You might like
UCenter 批量添加用户的php代码
2012/07/17 PHP
仿Aspnetpager的一个PHP分页类代码 附源码下载
2012/10/08 PHP
ThinkPHP结合ajax、Mysql实现的客户端通信功能代码示例
2014/06/23 PHP
详解ThinkPHP3.2.3验证码显示、刷新、校验
2016/12/29 PHP
使用CSS3实现字体颜色渐变的实现
2021/03/09 HTML / CSS
基于Jquery的简单&简陋Tabs插件代码
2010/02/09 Javascript
IE下js调试工具Companion.JS
2010/10/15 Javascript
JS 添加网页桌面快捷方式的代码详细整理
2012/12/27 Javascript
正则表达式搭配js轻松处理json文本方便而老古
2013/02/17 Javascript
JQuery Tips相关(1)----关于$.Ready()
2014/08/14 Javascript
JavaScript人脸识别技术及脸部识别JavaScript类库Tracking.js
2015/09/14 Javascript
Jquery easyui 实现动态树
2015/11/17 Javascript
js的form表单提交url传参数(包含+等特殊字符)的两种解决方法
2016/05/25 Javascript
修改js confirm alert 提示框文字的简单实例
2016/06/10 Javascript
深入理解Webpack 中路径的配置
2017/06/17 Javascript
js中如何完美的解析数据
2018/03/18 Javascript
使用webpack编译es6代码的方法步骤
2019/04/28 Javascript
vue配置接口域名方法总结
2019/05/12 Javascript
[01:18:36]LGD vs VP Supermajor 败者组决赛 BO3 第一场 6.10
2018/07/04 DOTA
python中map、any、all函数用法分析
2015/04/21 Python
python实现查找两个字符串中相同字符并输出的方法
2015/07/11 Python
django2用iframe标签完成网页内嵌播放b站视频功能
2018/06/20 Python
PyTorch 解决Dataset和Dataloader遇到的问题
2020/01/08 Python
logging level级别介绍
2020/02/21 Python
python检查目录文件权限并修改目录文件权限的操作
2020/03/11 Python
css3圆角边框和边框阴影示例
2014/05/05 HTML / CSS
德国百年厨具品牌WMF美国站:WMF美国
2016/09/12 全球购物
大学生个人推荐信范文
2013/11/25 职场文书
房地产开发计划书
2014/01/10 职场文书
公司口号大全
2014/06/11 职场文书
反洗钱宣传活动总结
2014/08/26 职场文书
导游经典开场白——导游词
2019/04/17 职场文书
幼儿园大班教师评语
2019/06/21 职场文书
JS实现扫雷项目总结
2021/05/19 Javascript
node.js使用express-fileupload中间件实现文件上传
2021/07/16 Javascript
使用GO语言实现Mysql数据库CURD的简单示例
2021/08/07 Golang