PyTorch快速搭建神经网络及其保存提取方法详解


Posted in Python onApril 28, 2018

有时候我们训练了一个模型, 希望保存它下次直接使用,不需要下次再花时间去训练 ,本节我们来讲解一下PyTorch快速搭建神经网络及其保存提取方法详解

一、PyTorch快速搭建神经网络方法

先看实验代码:

import torch 
import torch.nn.functional as F 
 
# 方法1,通过定义一个Net类来建立神经网络 
class Net(torch.nn.Module): 
  def __init__(self, n_feature, n_hidden, n_output): 
    super(Net, self).__init__() 
    self.hidden = torch.nn.Linear(n_feature, n_hidden) 
    self.predict = torch.nn.Linear(n_hidden, n_output) 
 
  def forward(self, x): 
    x = F.relu(self.hidden(x)) 
    x = self.predict(x) 
    return x 
 
net1 = Net(2, 10, 2) 
print('方法1:\n', net1) 
 
# 方法2 通过torch.nn.Sequential快速建立神经网络结构 
net2 = torch.nn.Sequential( 
  torch.nn.Linear(2, 10), 
  torch.nn.ReLU(), 
  torch.nn.Linear(10, 2), 
  ) 
print('方法2:\n', net2) 
# 经验证,两种方法构建的神经网络功能相同,结构细节稍有不同 
 
''''' 
方法1: 
 Net ( 
 (hidden): Linear (2 -> 10) 
 (predict): Linear (10 -> 2) 
) 
方法2: 
 Sequential ( 
 (0): Linear (2 -> 10) 
 (1): ReLU () 
 (2): Linear (10 -> 2) 
) 
'''

先前学习了通过定义一个Net类来构建神经网络的方法,classNet中首先通过super函数继承torch.nn.Module模块的构造方法,再通过添加属性的方式搭建神经网络各层的结构信息,在forward方法中完善神经网络各层之间的连接信息,然后再通过定义Net类对象的方式完成对神经网络结构的构建。

构建神经网络的另一个方法,也可以说是快速构建方法,就是通过torch.nn.Sequential,直接完成对神经网络的建立。

两种方法构建得到的神经网络结构完全相同,都可以通过print函数来打印输出网络信息,不过打印结果会有些许不同。

二、PyTorch的神经网络保存和提取

在学习和研究深度学习的时候,当我们通过一定时间的训练,得到了一个比较好的模型的时候,我们当然希望将这个模型及模型参数保存下来,以备后用,所以神经网络的保存和模型参数提取重载是很有必要的。

首先,我们需要在需要保存网路结构及其模型参数的神经网络的定义、训练部分之后通过torch.save()实现对网络结构和模型参数的保存。有两种保存方式:一是保存年整个神经网络的的结构信息和模型参数信息,save的对象是网络net;二是只保存神经网络的训练模型参数,save的对象是net.state_dict(),保存结果都以.pkl文件形式存储。

对应上面两种保存方式,重载方式也有两种。对应第一种完整网络结构信息,重载的时候通过torch.load(‘.pkl')直接初始化新的神经网络对象即可。对应第二种只保存模型参数信息,需要首先搭建相同的神经网络结构,通过net.load_state_dict(torch.load('.pkl'))完成模型参数的重载。在网络比较大的时候,第一种方法会花费较多的时间。

代码实现:

import torch 
from torch.autograd import Variable 
import matplotlib.pyplot as plt 
 
torch.manual_seed(1) # 设定随机数种子 
 
# 创建数据 
x = torch.unsqueeze(torch.linspace(-1, 1, 100), dim=1) 
y = x.pow(2) + 0.2*torch.rand(x.size()) 
x, y = Variable(x, requires_grad=False), Variable(y, requires_grad=False) 
 
# 将待保存的神经网络定义在一个函数中 
def save(): 
  # 神经网络结构 
  net1 = torch.nn.Sequential( 
    torch.nn.Linear(1, 10), 
    torch.nn.ReLU(), 
    torch.nn.Linear(10, 1), 
    ) 
  optimizer = torch.optim.SGD(net1.parameters(), lr=0.5) 
  loss_function = torch.nn.MSELoss() 
 
  # 训练部分 
  for i in range(300): 
    prediction = net1(x) 
    loss = loss_function(prediction, y) 
    optimizer.zero_grad() 
    loss.backward() 
    optimizer.step() 
 
  # 绘图部分 
  plt.figure(1, figsize=(10, 3)) 
  plt.subplot(131) 
  plt.title('net1') 
  plt.scatter(x.data.numpy(), y.data.numpy()) 
  plt.plot(x.data.numpy(), prediction.data.numpy(), 'r-', lw=5) 
 
  # 保存神经网络 
  torch.save(net1, '7-net.pkl')           # 保存整个神经网络的结构和模型参数 
  torch.save(net1.state_dict(), '7-net_params.pkl') # 只保存神经网络的模型参数 
 
# 载入整个神经网络的结构及其模型参数 
def reload_net(): 
  net2 = torch.load('7-net.pkl') 
  prediction = net2(x) 
 
  plt.subplot(132) 
  plt.title('net2') 
  plt.scatter(x.data.numpy(), y.data.numpy()) 
  plt.plot(x.data.numpy(), prediction.data.numpy(), 'r-', lw=5) 
 
# 只载入神经网络的模型参数,神经网络的结构需要与保存的神经网络相同的结构 
def reload_params(): 
  # 首先搭建相同的神经网络结构 
  net3 = torch.nn.Sequential( 
    torch.nn.Linear(1, 10), 
    torch.nn.ReLU(), 
    torch.nn.Linear(10, 1), 
    ) 
 
  # 载入神经网络的模型参数 
  net3.load_state_dict(torch.load('7-net_params.pkl')) 
  prediction = net3(x) 
 
  plt.subplot(133) 
  plt.title('net3') 
  plt.scatter(x.data.numpy(), y.data.numpy()) 
  plt.plot(x.data.numpy(), prediction.data.numpy(), 'r-', lw=5) 
 
# 运行测试 
save() 
reload_net() 
reload_params()

实验结果:

PyTorch快速搭建神经网络及其保存提取方法详解

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Tornado Web服务器多进程启动的2个方法
Aug 04 Python
浅析Python多线程下的变量问题
Apr 28 Python
在Django中同时使用多个配置文件的方法
Jul 22 Python
在Python程序中操作MySQL的基本方法
Jul 29 Python
python递归查询菜单并转换成json实例
Mar 27 Python
python时间日期函数与利用pandas进行时间序列处理详解
Mar 13 Python
python实现淘宝秒杀脚本
Jun 23 Python
python 统计文件中的字符串数目示例
Dec 24 Python
使用python绘制cdf的多种实现方法
Feb 25 Python
Python调用接口合并Excel表代码实例
Mar 31 Python
python神经网络编程之手写数字识别
May 08 Python
分享python函数常见关键字
Apr 26 Python
对Python中type打开文件的方式介绍
Apr 28 #Python
PyTorch上搭建简单神经网络实现回归和分类的示例
Apr 28 #Python
TensorFlow实现非线性支持向量机的实现方法
Apr 28 #Python
python 通过logging写入日志到文件和控制台的实例
Apr 28 #Python
Python实现合并同一个文件夹下所有PDF文件的方法示例
Apr 28 #Python
用TensorFlow实现多类支持向量机的示例代码
Apr 28 #Python
详谈python在windows中的文件路径问题
Apr 28 #Python
You might like
用PHP查询域名状态whois的类
2006/11/25 PHP
PHP URL地址获取函数代码(端口等) 推荐
2010/05/15 PHP
php调用mysql数据 dbclass类
2011/05/07 PHP
PHP中对用户身份认证实现两种方法
2011/06/04 PHP
Zend Framework入门知识点小结
2016/03/19 PHP
php制作圆形用户头像的实例_自定义封装类源代码
2017/09/18 PHP
关于ThinkPHP中的异常处理详解
2018/05/11 PHP
PHP笛卡尔积实现原理及代码实例
2020/12/09 PHP
用函数式编程技术编写优美的 JavaScript
2006/11/25 Javascript
用JS实现一个TreeMenu效果分享
2011/08/28 Javascript
jquery select动态加载选择(兼容各种浏览器)
2013/02/01 Javascript
javascript格式化json显示实例分析
2015/04/21 Javascript
使用Curl命令查看请求响应时间方法
2016/11/04 Javascript
JS利用cookies设置每隔24小时弹出框
2017/04/20 Javascript
jQuery Validate格式验证功能实例代码(包括重名验证)
2017/07/18 jQuery
Vue 组件间的样式冲突污染
2017/08/31 Javascript
详解Angular6.0使用路由步骤(共7步)
2018/06/29 Javascript
js实现提交前对列表数据的增删改查
2020/01/16 Javascript
js 图片懒加载的实现
2020/10/21 Javascript
[01:03]PWL开团时刻DAY6——别打我
2020/11/05 DOTA
Pyramid将models.py文件的内容分布到多个文件的方法
2013/11/27 Python
django进阶之cookie和session的使用示例
2018/08/17 Python
django中上传图片分页三级联动效果的实现代码
2019/08/30 Python
基于MSELoss()与CrossEntropyLoss()的区别详解
2020/01/02 Python
Python OpenCV读取中文路径图像的方法
2020/07/02 Python
python sleep和wait对比总结
2021/02/03 Python
纪伊国屋泰国网上书店:Kinokuniya泰国
2017/12/24 全球购物
Cotton On香港网站:澳洲时装连锁品牌
2018/11/01 全球购物
澳大利亚Mocha官方网站:包、钱包、珠宝和配饰
2019/07/18 全球购物
历史学专业大学生找工作的自我评价
2013/10/16 职场文书
服装设计专业毕业生推荐信
2013/11/09 职场文书
物流管理毕业生自荐信范文
2014/03/15 职场文书
2014年个人债务授权委托书范本
2014/09/22 职场文书
贪污检举信范文
2015/03/02 职场文书
2015年采购工作总结
2015/04/10 职场文书
MySQL 时间类型的选择
2021/06/05 MySQL