pytorch 实现模型不同层设置不同的学习率方式


Posted in Python onJanuary 06, 2020

在目标检测的模型训练中, 我们通常都会有一个特征提取网络backbone, 例如YOLO使用的darknet SSD使用的VGG-16。

为了达到比较好的训练效果, 往往会加载预训练的backbone模型参数, 然后在此基础上训练检测网络, 并对backbone进行微调, 这时候就需要为backbone设置一个较小的lr。

class net(torch.nn.Module):
  def __init__(self):
    super(net, self).__init__()
    # backbone
    self.backbone = ...
    # detect
    self....

在设置optimizer时, 只需要参数分为两个部分, 并分别给定不同的学习率lr。

base_params = list(map(id, net.backbone.parameters()))
logits_params = filter(lambda p: id(p) not in base_params, net.parameters())
params = [
  {"params": logits_params, "lr": config.lr},
  {"params": net.backbone.parameters(), "lr": config.backbone_lr},
]
optimizer = torch.optim.SGD(params, momentum=config.momentum, weight_decay=config.weight_decay)

以上这篇pytorch 实现模型不同层设置不同的学习率方式就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python中wx将图标显示在右下角的脚本代码
Mar 08 Python
实例讲解python函数式编程
Jun 09 Python
浅析Python中的序列化存储的方法
Apr 28 Python
Python入门教程之运算符与控制流
Aug 17 Python
Python多线程threading和multiprocessing模块实例解析
Jan 29 Python
查看Django和flask版本的方法
May 14 Python
Python使用jsonpath-rw模块处理Json对象操作示例
Jul 31 Python
利用arcgis的python读取要素的X,Y方法
Dec 22 Python
Python设计模式之观察者模式原理与用法详解
Jan 16 Python
python去重,一个由dict组成的list的去重示例
Jan 21 Python
浅谈python的输入输出,注释,基本数据类型
Apr 02 Python
python读取pdf格式文档的实现代码
Apr 01 Python
浅析Python3 pip换源问题
Jan 06 #Python
通过实例学习Python Excel操作
Jan 06 #Python
pytorch载入预训练模型后,实现训练指定层
Jan 06 #Python
python与mysql数据库交互的实现
Jan 06 #Python
win10系统下python3安装及pip换源和使用教程
Jan 06 #Python
基于python实现文件加密功能
Jan 06 #Python
Pytorch 实现冻结指定卷积层的参数
Jan 06 #Python
You might like
用PHP实现ODBC数据分页显示一例
2006/10/09 PHP
PHP面向对象五大原则之接口隔离原则(ISP)详解
2018/04/04 PHP
PHP手机短信验证码实现流程详解
2018/05/17 PHP
php解决约瑟夫环算法实例分析
2019/09/30 PHP
javascript入门·对象属性方法大总结
2007/10/01 Javascript
ExtJS Window 最小化的一种方法
2009/11/18 Javascript
jquery焦点图片切换(数字标注/手动/自动播放/横向滚动)
2013/01/24 Javascript
一个页面元素appendchild追加到另一个页面元素的问题
2013/01/27 Javascript
文本框(input)获取焦点(onfocus)时样式改变的示例代码
2014/01/10 Javascript
jquery配合.NET实现点击指定绑定数据并且能够一键下载
2016/10/28 Javascript
使用微信内嵌H5网页解决JS倒计时失效问题
2017/01/13 Javascript
基于jQuery.i18n实现web前端的国际化
2018/05/04 jQuery
Mac下通过brew安装指定版本的nodejs教程
2018/05/17 NodeJs
Python下的Mysql模块MySQLdb安装详解
2014/04/09 Python
Python上传package到Pypi(代码简单)
2016/02/06 Python
利用Python脚本生成sitemap.xml的实现方法
2017/01/31 Python
批量将ppt转换为pdf的Python代码 只要27行!
2018/02/26 Python
符合语言习惯的 Python 优雅编程技巧【推荐】
2018/09/25 Python
Python3匿名函数lambda介绍与使用示例
2019/05/18 Python
由面试题加深对Django的认识理解
2019/07/19 Python
Python使用ffmpy将amr格式的音频转化为mp3格式的例子
2019/08/08 Python
Python读取YAML文件过程详解
2019/12/30 Python
基于Python3读写INI配置文件过程解析
2020/07/23 Python
详解Django中异步任务之django-celery
2020/11/05 Python
美国旅游网站:Tours4Fun
2017/02/17 全球购物
Bally美国官网:经典瑞士鞋履、手袋及配饰奢侈品牌
2018/05/18 全球购物
Linux开机引导的步骤是什么
2014/02/26 面试题
医学生实习自我鉴定
2013/09/27 职场文书
网络教育毕业生自我鉴定
2013/10/10 职场文书
师范毕业生个人求职信
2013/12/09 职场文书
生产厂厂长岗位职责
2013/12/25 职场文书
会计专业自我鉴定范文
2013/12/29 职场文书
汽车专业学生自我评价
2014/01/19 职场文书
团支部推优材料
2014/05/21 职场文书
在校实习生求职信
2014/06/18 职场文书
悬空寺导游词
2015/02/05 职场文书