编程 Python

pytorch自定义初始化权重的方法

Posted in Python onAugust 17, 2019

在常见的pytorch代码中，我们见到的初始化方式都是调用init类对每层所有参数进行初始化。但是，有时我们有些特殊需求，比如用某一层的权重取优化其它层，或者手动指定某些权重的初始值。

核心思想就是构造和该层权重同一尺寸的矩阵去对该层权重赋值。但是，值得注意的是，pytorch中各层权重的数据类型是nn.Parameter，而不是Tensor或者Variable。

import torch
import torch.nn as nn
import torch.optim as optim
import numpy as np
 
# 第一一个卷积层，我们可以看到它的权值是随机初始化的
w=torch.nn.Conv2d(2,2,3,padding=1)
print(w.weight)
 
 
# 第一种方法
print("1.使用另一个Conv层的权值")
q=torch.nn.Conv2d(2,2,3,padding=1) # 假设q代表一个训练好的卷积层
print(q.weight) # 可以看到q的权重和w是不同的
w.weight=q.weight # 把一个Conv层的权重赋值给另一个Conv层
print(w.weight)
 
# 第二种方法
print("2.使用来自Tensor的权值")
ones=torch.Tensor(np.ones([2,2,3,3])) # 先创建一个自定义权值的Tensor，这里为了方便将所有权值设为1
w.weight=torch.nn.Parameter(ones) # 把Tensor的值作为权值赋值给Conv层，这里需要先转为torch.nn.Parameter类型，否则将报错
print(w.weight)

附：Variable和Parameter的区别

Parameter 是torch.autograd.Variable的一个字类，常被用于Module的参数。例如权重和偏置。

Parameters和Modules一起使用的时候会有一些特殊的属性。parameters赋值给Module的属性的时候，它会被自动加到Module的参数列表中，即会出现在Parameter()迭代器中。将Varaible赋给Module的时候没有这样的属性。这可以在nn.Module的实现中详细看一下。这样做是为了保存模型的时候只保存权重偏置参数，不保存节点值。所以复写Variable加以区分。

另外一个不同是parameter不能设置volatile，而且require_grad默认设置为true。Varaible默认设置为False.

参数：

parameter.data 得到tensor数据

parameter.requires_grad 默认为True， BP过程中会求导

Parameter一般是在Modules中作为权重和偏置，自动加入参数列表，可以进行保存恢复。和Variable具有相同的运算。

我们可以这样简单区分，在计算图中，数据（包括输入数据和计算过程中产生的feature map等）时variable类型，该类型不会被保存到模型中。网络的权重是parameter类型，在计算过程中会被更新，将会被保存到模型中。

以上这篇pytorch自定义初始化权重的方法就是小编分享给大家的全部内容了，希望能给大家一个参考，也希望大家多多支持三水点靠木。

pytorch自定义初始化权重的方法

- Author -

goodxin_ie

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

基于python编写的微博应用

Oct 17 Python

Python pickle类库介绍（对象序列化和反序列化）

Nov 21 Python

Saltstack快速入门简单汇总

Mar 01 Python

Python实现输入二叉树的先序和中序遍历，再输出后序遍历操作示例

Jul 27 Python

Python批处理更改文件名os.rename的方法

Oct 26 Python

为什么你还不懂得怎么使用Python协程

May 13 Python

Django 中自定义 Admin 样式与功能的实现方法

Jul 04 Python

感知器基础原理及python实现过程详解

Sep 30 Python

Python通过文本和图片生成词云图

May 21 Python

Python使用Selenium模拟浏览器自动操作功能

Sep 08 Python

python如何利用paramiko执行服务器命令

Nov 07 Python

python如何利用traceback获取详细的异常信息

Jun 05 Python

在Pytorch中使用样本权重(sample_weight)的正确方法

Aug 17 #Python

获取Pytorch中间某一层权重或者特征的例子

Aug 17 #Python

pyenv与virtualenv安装实现python多版本多项目管理

Aug 17 #Python

pytorch 获取层权重,对特定层注入hook, 提取中间层输出的方法

Aug 17 #Python

关于PyTorch源码解读之torchvision.models

Aug 17 #Python

django项目用higcharts统计最近七天文章点击量

Aug 17 #Python

Django对models里的objects的使用详解

Aug 17 #Python

You might like

PHP自动生成表单代码分享

2015/06/19 PHP

[原创]smarty简单模板变量输出方法

2016/07/09 PHP

php7下的filesize函数

2019/09/30 PHP

javascript TextArea动态显示剩余字符

2008/10/22 Javascript

extjs 的权限问题要求控制的对象是菜单，按钮，URL

2010/03/09 Javascript

javascript工具库代码

2012/03/29 Javascript

JavaScript中的return语句简单介绍

2015/12/07 Javascript

JavaScript类型系统之正则表达式

2016/01/05 Javascript

JS动态创建元素的两种方法

2016/04/20 Javascript

AngularJS 中的Promise --- $q服务详解

2016/09/14 Javascript

JS出现失效的情况总结

2017/01/20 Javascript

BootStrap点击保存后实现模态框自动关闭的思路(模态框)

2017/09/26 Javascript

vue webpack实用技巧总结

2018/04/24 Javascript

JS 音频可视化插件Wavesurfer.js的使用教程

2018/10/31 Javascript

Vue监听滚动实现锚点定位(双向)示例

2019/11/13 Javascript

Angular封装表单控件及思想总结

2019/12/11 Javascript

Python3计算三角形的面积代码

2017/12/18 Python

基于并发服务器几种实现方法(总结)

2017/12/29 Python

python中requests和https使用简单示例

2018/01/18 Python

tensorflow 加载部分变量的实例讲解

2018/07/27 Python

给你一面国旗教你用python画中国国旗

2019/09/24 Python

python创建学生管理系统

2019/11/22 Python

Python QTimer实现多线程及QSS应用过程解析

2020/07/11 Python

CSS3绘制超炫的上下起伏波动进度加载动画

2016/04/21 HTML / CSS

MCAKE蛋糕官方网站：一直都是巴黎的味道

2018/02/06 全球购物

美国购物网站：Clickhere2shop

2021/01/28 全球购物

程序员跳槽必看面试题总结

2013/06/28 面试题

高级文秘工作总结的自我评价

2013/09/28 职场文书

工程力学专业毕业生求职信

2013/10/06 职场文书

大学生新闻专业个人自我评价

2013/11/12 职场文书

企业行政文员岗位职责

2013/12/03 职场文书

怎样写好自我鉴定

2013/12/04 职场文书

装修施工安全责任书

2014/07/24 职场文书

研究生导师推荐信

2014/09/06 职场文书

湖南省党的群众路线教育实践活动总结会议新闻稿

2014/10/21 职场文书

2015年音乐教研组工作总结

2015/07/22 职场文书