编程 Python

pytorch 中autograd.grad()函数的用法说明

Posted in Python onMay 12, 2021

我们在用神经网络求解PDE时，经常要用到输出值对输入变量（不是Weights和Biases）求导；在训练WGAN-GP 时，也会用到网络对输入变量的求导。

以上两种需求，均可以用pytorch 中的autograd.grad() 函数实现。

autograd.grad(outputs, inputs, grad_outputs=None, retain_graph=None, create_graph=False, only_inputs=True, allow_unused=False)

outputs: 求导的因变量（需要求导的函数）

inputs: 求导的自变量

grad_outputs: 如果 outputs为标量，则grad_outputs=None,也就是说，可以不用写; 如果outputs 是向量，则此参数必须写，不写将会报如下错误：

pytorch 中autograd.grad()函数的用法说明

那么此参数究竟代表着什么呢？

先假设 pytorch 中autograd.grad()函数的用法说明 为一维向量, 即可设自变量因变量分别为，其对应的 Jacobi 矩阵为

pytorch 中autograd.grad()函数的用法说明

grad_outputs 是一个shape 与 outputs 一致的向量, 即

pytorch 中autograd.grad()函数的用法说明

在给定grad_outputs 之后，真正返回的梯度为

pytorch 中autograd.grad()函数的用法说明

为方便下文叙述我们引入记号 pytorch 中autograd.grad()函数的用法说明

其次假设 pytorch 中autograd.grad()函数的用法说明 ,第i个列向量对应的Jacobi矩阵为

pytorch 中autograd.grad()函数的用法说明

此时的grad_outputs 为(维度与outputs一致)

pytorch 中autograd.grad()函数的用法说明

由第一种情况，我们有

pytorch 中autograd.grad()函数的用法说明

也就是说对输出变量的列向量求导，再经过权重累加。

若 pytorch 中autograd.grad()函数的用法说明沿用第一种情况记号

pytorch 中autograd.grad()函数的用法说明 , 其中每一个均由第一种方法得出，

即对输入变量列向量求导，之后按照原先顺序排列即可。

retain_graph: True 则保留计算图， False则释放计算图

create_graph: 若要计算高阶导数，则必须选为True

allow_unused: 允许输入变量不进入计算

下面我们看一下具体的例子：

import torch
from torch import autograd
 
x = torch.rand(3, 4)
x.requires_grad_()

观察 x 为

pytorch 中autograd.grad()函数的用法说明

不妨设 y 是 x 所有元素的和，因为 y是标量，故计算导数不需要设置grad_outputs

y = torch.sum(x)
grads = autograd.grad(outputs=y, inputs=x)[0]
print(grads)

结果为

pytorch 中autograd.grad()函数的用法说明

若y是向量

y = x[:,0] +x[:,1]
# 设置输出权重为1
grad = autograd.grad(outputs=y, inputs=x, grad_outputs=torch.ones_like(y))[0]
print(grad)
# 设置输出权重为0
grad = autograd.grad(outputs=y, inputs=x, grad_outputs=torch.zeros_like(y))[0]
print(grad)

结果为

pytorch 中autograd.grad()函数的用法说明

最后，我们通过设置 create_graph=True 来计算二阶导数

y = x ** 2
grad = autograd.grad(outputs=y, inputs=x, grad_outputs=torch.ones_like(y), create_graph=True)[0]
grad2 = autograd.grad(outputs=grad, inputs=x, grad_outputs=torch.ones_like(grad))[0]
print(grad2)

结果为

pytorch 中autograd.grad()函数的用法说明

综上，我们便搞清楚了它的求导机制。

补充：pytorch学习笔记：自动微分机制(backward、torch.autograd.grad)

一、前言

神经网络通常依赖反向传播求梯度来更新网络参数，求梯度过程通常是一件非常复杂而容易出错的事情。

而深度学习框架可以帮助我们自动地完成这种求梯度运算。

Pytorch一般通过反向传播 backward方法实现这种求梯度计算。该方法求得的梯度将存在对应自变量张量的grad属性下。

除此之外，也能够调用torch.autograd.grad函数来实现求梯度计算。

这就是Pytorch的自动微分机制。

二、利用backward方法求导数

backward方法通常在一个标量张量上调用，该方法求得的梯度将存在对应自变量张量的grad属性下。如果调用的张量非标量，则要传入一个和它同形状的gradient参数张量。相当于用该gradient参数张量与调用张量作向量点乘，得到的标量结果再反向传播。

1, 标量的反向传播

import numpy as np 
import torch 

# f(x) = a*x**2 + b*x + c的导数

x = torch.tensor(0.0,requires_grad = True) # x需要被求导
a = torch.tensor(1.0)
b = torch.tensor(-2.0)
c = torch.tensor(1.0)
y = a*torch.pow(x,2) + b*x + c 

y.backward()
dy_dx = x.grad
print(dy_dx)

输出：

tensor(-2.)

2, 非标量的反向传播

import numpy as np 
import torch 

# f(x) = a*x**2 + b*x + c

x = torch.tensor([[0.0,0.0],[1.0,2.0]],requires_grad = True) # x需要被求导
a = torch.tensor(1.0)
b = torch.tensor(-2.0)
c = torch.tensor(1.0)
y = a*torch.pow(x,2) + b*x + c 

gradient = torch.tensor([[1.0,1.0],[1.0,1.0]])

print("x:\n",x)
print("y:\n",y)
y.backward(gradient = gradient)
x_grad = x.grad
print("x_grad:\n",x_grad)

输出：

x:

tensor([[0., 0.],

[1., 2.]], requires_grad=True)

y:

tensor([[1., 1.],

[0., 1.]], grad_fn=<AddBackward0>)

x_grad:

tensor([[-2., -2.],

[ 0., 2.]])

3, 非标量的反向传播可以用标量的反向传播实现

import numpy as np 
import torch 

# f(x) = a*x**2 + b*x + c

x = torch.tensor([[0.0,0.0],[1.0,2.0]],requires_grad = True) # x需要被求导
a = torch.tensor(1.0)
b = torch.tensor(-2.0)
c = torch.tensor(1.0)
y = a*torch.pow(x,2) + b*x + c 

gradient = torch.tensor([[1.0,1.0],[1.0,1.0]])
z = torch.sum(y*gradient)

print("x:",x)
print("y:",y)
z.backward()
x_grad = x.grad
print("x_grad:\n",x_grad)

输出：

x: tensor([[0., 0.],

[1., 2.]], requires_grad=True)

y: tensor([[1., 1.],

[0., 1.]], grad_fn=<AddBackward0>)

x_grad:

tensor([[-2., -2.],

[ 0., 2.]])

三、利用autograd.grad方法求导数

import numpy as np 
import torch 

# f(x) = a*x**2 + b*x + c的导数

x = torch.tensor(0.0,requires_grad = True) # x需要被求导
a = torch.tensor(1.0)
b = torch.tensor(-2.0)
c = torch.tensor(1.0)
y = a*torch.pow(x,2) + b*x + c


# create_graph 设置为 True 将允许创建更高阶的导数 
dy_dx = torch.autograd.grad(y,x,create_graph=True)[0]
print(dy_dx.data)

# 求二阶导数
dy2_dx2 = torch.autograd.grad(dy_dx,x)[0] 

print(dy2_dx2.data)

输出：

tensor(-2.)

tensor(2.)

import numpy as np 
import torch 

x1 = torch.tensor(1.0,requires_grad = True) # x需要被求导
x2 = torch.tensor(2.0,requires_grad = True)

y1 = x1*x2
y2 = x1+x2


# 允许同时对多个自变量求导数
(dy1_dx1,dy1_dx2) = torch.autograd.grad(outputs=y1,
                inputs = [x1,x2],retain_graph = True)
print(dy1_dx1,dy1_dx2)

# 如果有多个因变量，相当于把多个因变量的梯度结果求和
(dy12_dx1,dy12_dx2) = torch.autograd.grad(outputs=[y1,y2],
            inputs = [x1,x2])
print(dy12_dx1,dy12_dx2)

输出：

tensor(2.) tensor(1.)

tensor(3.) tensor(2.)

四、利用自动微分和优化器求最小值

import numpy as np 
import torch 

# f(x) = a*x**2 + b*x + c的最小值

x = torch.tensor(0.0,requires_grad = True) # x需要被求导
a = torch.tensor(1.0)
b = torch.tensor(-2.0)
c = torch.tensor(1.0)

optimizer = torch.optim.SGD(params=[x],lr = 0.01)


def f(x):
    result = a*torch.pow(x,2) + b*x + c 
    return(result)

for i in range(500):
    optimizer.zero_grad()
    y = f(x)
    y.backward()
    optimizer.step()
   
    
print("y=",f(x).data,";","x=",x.data)

输出：

y= tensor(0.) ; x= tensor(1.0000)

以上为个人经验，希望能给大家一个参考，也希望大家多多支持三水点靠木。如有错误或未考虑完全的地方，望不吝赐教。

pytorch 中autograd.grad()函数的用法说明

- Author -

waitingwinter

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

Python multiprocessing模块中的Pipe管道使用实例

Apr 11 Python

使用IDLE的Python shell窗口实例详解

Nov 19 Python

Django集成celery发送异步邮件实例

Dec 17 Python

python 普通克里金（Kriging）法的实现

Dec 19 Python

解决tensorflow添加ptb库的问题

Feb 10 Python

python新式类和经典类的区别实例分析

Mar 23 Python

Python装饰器的应用场景代码总结

Apr 10 Python

Pytorch实现将模型的所有参数的梯度清0

Jun 24 Python

Python logging日志库空间不足问题解决

Sep 14 Python

python爬虫爬取淘宝商品比价(附淘宝反爬虫机制解决小办法)

Dec 03 Python

python 命令行传参方法总结

May 25 Python

Keras多线程机制与flask多线程冲突的解决方案

May 28 Python

python3实现无权最短路径的方法

Python入门之基础语法详解

May 11 #Python

如何利用Matlab制作一款真正的拼图小游戏

Python机器学习之逻辑回归

Python Pandas知识点之缺失值处理详解

Pytorch实现图像识别之数字识别(附详细注释)

浅谈Python基础之列表那些事儿

You might like

php中看实例学正则表达式

2006/12/25 PHP

php 转换字符串编码 iconv与mb_convert_encoding的区别说明

2011/11/10 PHP

php入门之连接mysql数据库的一个类

2012/04/21 PHP

iis下php mail函数的sendmail配置方法(官方推荐)

2012/04/25 PHP

PHP中如何调用webservice的实例参考

2013/04/25 PHP

php过滤XSS攻击的函数

2013/11/12 PHP

在IE下获取object（ActiveX）的Param的代码

2009/09/15 Javascript

jquery 全局AJAX事件使用代码

2010/11/05 Javascript

js前台判断开始时间是否小于结束时间

2012/02/23 Javascript

js获取IP和PcName(IE)在vs中可用

2013/08/02 Javascript

CSS javascript 结合实现悬浮固定菜单效果

2015/08/23 Javascript

JS实现页面数据无限加载

2016/09/13 Javascript

JS冒泡事件与事件捕获实例详解

2016/11/25 Javascript

Node.JS用纯JavaScript生成图片或滑块式验证码功能

2019/09/12 Javascript

JavaScript setInterval()与setTimeout()计时器

2019/12/27 Javascript

js实现中文实时时钟

2020/01/15 Javascript

[44:04]OG vs Mineski 2018国际邀请赛小组赛BO2 第一场 8.17

2018/08/18 DOTA

Python的Twisted框架上手前所必须了解的异步编程思想

2016/05/25 Python

利用python实现命令行有道词典的方法示例

2017/01/31 Python

Python简单实现Base64编码和解码的方法

2017/04/29 Python

python 函数传参之传值还是传引用的分析

2017/09/07 Python

Python3.6连接Oracle数据库的方法详解

2018/05/18 Python

解决python 自动安装缺少模块的问题

2018/10/22 Python

Python GUI编程学习笔记之tkinter界面布局显示详解

2020/03/30 Python

在服务器上安装python3.8.2环境的教程详解

2020/04/26 Python

PyTorch-GPU加速实例

2020/06/23 Python

python脚本和网页有何区别

2020/07/02 Python

python 删除系统中的文件(按时间,大小,扩展名)

2020/11/19 Python

html5 Canvas画图教程(5)—canvas里画曲线之arc方法

2013/01/09 HTML / CSS

英国天然保健品网站：Simply Supplements

2017/03/22 全球购物

2013英文求职信模板范文

2013/11/15 职场文书

会计岗位描述

2014/02/22 职场文书

一份没有按时交货失信于客户的检讨书

2014/09/19 职场文书

2015年采购部工作总结

2015/04/23 职场文书

校友会致辞

2015/07/30 职场文书

mysql数据库如何转移到oracle

2022/12/24 MySQL