基于pytorch中的Sequential用法说明


Posted in Python onJune 24, 2020

class torch.nn.Sequential(* args)

一个时序容器。Modules 会以他们传入的顺序被添加到容器中。当然,也可以传入一个OrderedDict。

为了更容易的理解如何使用Sequential, 下面给出了一个例子:

# Example of using Sequential
 
model = nn.Sequential(
     nn.Conv2d(1,20,5),
     nn.ReLU(),
     nn.Conv2d(20,64,5),
     nn.ReLU()
    )
# Example of using Sequential with OrderedDict
model = nn.Sequential(OrderedDict([
     ('conv1', nn.Conv2d(1,20,5)),
     ('relu1', nn.ReLU()),
     ('conv2', nn.Conv2d(20,64,5)),
     ('relu2', nn.ReLU())
    ]))

补充知识:pytorch 中 torch.optim.Adam 方法的使用和参数的解释

class torch.optim.Adam(params, lr=0.001, betas=(0.9, 0.999), eps=1e-08, weight_decay=0)[source]

实现Adam算法。

它在Adam: A Method for Stochastic Optimization中被提出。

参数:

params (iterable) ? 待优化参数的iterable或者是定义了参数组的dict

lr (float, 可选) ? 学习率(默认:1e-3)

betas (Tuple[float, float], 可选) ? 用于计算梯度以及梯度平方的运行平均值的系数(默认:0.9,0.999)

eps (float, 可选) ? 为了增加数值计算的稳定性而加到分母里的项(默认:1e-8)

weight_decay (float, 可选) ? 权重衰减(L2惩罚)(默认: 0)

个人理解:

lr:同样也称为学习率或步长因子,它控制了权重的更新比率(如 0.001)。较大的值(如 0.3)在学习率更新前会有更快的初始学习,而较小的值(如 1.0E-5)会令训练收敛到更好的性能。

betas = (beta1,beta2)

beta1:一阶矩估计的指数衰减率(如 0.9)。

beta2:二阶矩估计的指数衰减率(如 0.999)。该超参数在稀疏梯度(如在 NLP 或计算机视觉任务中)中应该设置为接近 1 的数。

eps:epsilon:该参数是非常小的数,其为了防止在实现中除以零(如 10E-8)。

读者可结合官方文档中的参数说明和我的个人理解掌握该函数的用法。

以上这篇基于pytorch中的Sequential用法说明就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python图像处理之反色实现方法
May 30 Python
Python文件操作基本流程代码实例
Dec 11 Python
Python字符串格式化%s%d%f详解
Feb 02 Python
python2.7+selenium2实现淘宝滑块自动认证功能
Feb 24 Python
python人民币小写转大写辅助工具
Jun 20 Python
python调用虹软2.0第三版的具体使用
Feb 22 Python
Python multiprocessing多进程原理与应用示例
Feb 28 Python
python2.7实现复制大量文件及文件夹资料
Aug 31 Python
python主线程与子线程的结束顺序实例解析
Dec 17 Python
python怎么调用自己的函数
Jul 01 Python
Python爬虫基础之初次使用scrapy爬虫实例
Jun 26 Python
Python多线程实用方法以及共享变量资源竞争问题
Apr 12 Python
django haystack实现全文检索的示例代码
Jun 24 #Python
Python爬虫如何应对Cloudflare邮箱加密
Jun 24 #Python
python使用自定义钉钉机器人的示例代码
Jun 24 #Python
pytorch中的weight-initilzation用法
Jun 24 #Python
pytorch查看模型weight与grad方式
Jun 24 #Python
pytorch  网络参数 weight bias 初始化详解
Jun 24 #Python
可视化pytorch 模型中不同BN层的running mean曲线实例
Jun 24 #Python
You might like
php生成随机数或者字符串的代码
2008/09/05 PHP
PHP判断搜索引擎蜘蛛并自动记忆到文件的代码
2012/02/04 PHP
php漏洞之跨网站请求伪造与防止伪造方法
2013/08/15 PHP
PHP常用处理静态操作类
2015/04/03 PHP
YII框架实现自定义第三方扩展操作示例
2019/04/26 PHP
jQuery 1.4 15个你应该知道的新特性(译)
2010/01/24 Javascript
Js-$.extend扩展方法使方法参数更灵活
2013/01/15 Javascript
Google Map V3 绑定气泡窗口(infowindow)Dom事件实现代码
2013/04/26 Javascript
Jquery遍历节点的方法小集
2014/01/22 Javascript
用js代码和插件实现wordpress雪花飘落效果的四种方法
2014/12/15 Javascript
Grunt入门教程(自动任务运行器)
2015/08/06 Javascript
JS仿hao123导航页面图片轮播效果
2016/09/01 Javascript
详谈js中window.location.search的用法和作用
2017/02/13 Javascript
jQuery用noConflict代替$的实现方法
2017/04/12 jQuery
vue实现nav导航栏的方法
2017/12/13 Javascript
10行原生JS实现文字无缝滚动(超简单)
2018/01/02 Javascript
微信小程序实现弹出菜单功能
2018/06/12 Javascript
jQuery实现模糊搜索功能的方法分析
2018/06/29 jQuery
JavaScript使用prototype原型实现的封装继承多态示例
2018/08/31 Javascript
Vue通过WebSocket建立长连接的实现代码
2019/11/05 Javascript
Python书单 不将就
2017/07/11 Python
Python机器学习算法之k均值聚类(k-means)
2018/02/23 Python
Python数据可视化之画图
2019/01/15 Python
django解决跨域请求的问题详解
2019/01/20 Python
python绘制直方图和密度图的实例
2019/07/08 Python
Python3 翻转二叉树的实现
2019/09/30 Python
pytorch GAN生成对抗网络实例
2020/01/10 Python
基于plt.title无法显示中文的快速解决
2020/05/16 Python
利用python控制Autocad:pyautocad方式
2020/06/01 Python
五种Python转义表示法
2020/11/27 Python
介绍一下Cookie和Session及他们之间的区别
2012/11/20 面试题
四种会话跟踪技术
2015/05/20 面试题
生育关怀行动实施方案
2014/03/26 职场文书
法人代表授权委托书范文
2014/09/10 职场文书
公司辞职信模板
2015/05/13 职场文书