编程 Python

详解PyTorch批训练及优化器比较

Posted in Python onApril 28, 2018

一、PyTorch批训练

1. 概述

PyTorch提供了一种将数据包装起来进行批训练的工具——DataLoader。使用的时候，只需要将我们的数据首先转换为torch的tensor形式，再转换成torch可以识别的Dataset格式，然后将Dataset放入DataLoader中就可以啦。

import torch 
import torch.utils.data as Data 
 
torch.manual_seed(1) # 设定随机数种子 
 
BATCH_SIZE = 5 
 
x = torch.linspace(1, 10, 10) 
y = torch.linspace(0.5, 5, 10) 
 
# 将数据转换为torch的dataset格式 
torch_dataset = Data.TensorDataset(data_tensor=x, target_tensor=y) 
 
# 将torch_dataset置入Dataloader中 
loader = Data.DataLoader( 
  dataset=torch_dataset, 
  batch_size=BATCH_SIZE, # 批大小 
  # 若dataset中的样本数不能被batch_size整除的话，最后剩余多少就使用多少 
  shuffle=True, # 是否随机打乱顺序 
  num_workers=2, # 多线程读取数据的线程数 
  ) 
 
for epoch in range(3): 
  for step, (batch_x, batch_y) in enumerate(loader): 
    print('Epoch:', epoch, '|Step:', step, '|batch_x:', 
       batch_x.numpy(), '|batch_y', batch_y.numpy()) 
''''' 
shuffle=True 
Epoch: 0 |Step: 0 |batch_x: [ 6. 7. 2. 3. 1.] |batch_y [ 3.  3.5 1.  1.5 0.5] 
Epoch: 0 |Step: 1 |batch_x: [ 9. 10.  4.  8.  5.] |batch_y [ 4.5 5.  2.  4.  2.5] 
Epoch: 1 |Step: 0 |batch_x: [ 3.  4.  2.  9. 10.] |batch_y [ 1.5 2.  1.  4.5 5. ] 
Epoch: 1 |Step: 1 |batch_x: [ 1. 7. 8. 5. 6.] |batch_y [ 0.5 3.5 4.  2.5 3. ] 
Epoch: 2 |Step: 0 |batch_x: [ 3. 9. 2. 6. 7.] |batch_y [ 1.5 4.5 1.  3.  3.5] 
Epoch: 2 |Step: 1 |batch_x: [ 10.  4.  8.  1.  5.] |batch_y [ 5.  2.  4.  0.5 2.5] 
 
shuffle=False 
Epoch: 0 |Step: 0 |batch_x: [ 1. 2. 3. 4. 5.] |batch_y [ 0.5 1.  1.5 2.  2.5] 
Epoch: 0 |Step: 1 |batch_x: [ 6.  7.  8.  9. 10.] |batch_y [ 3.  3.5 4.  4.5 5. ] 
Epoch: 1 |Step: 0 |batch_x: [ 1. 2. 3. 4. 5.] |batch_y [ 0.5 1.  1.5 2.  2.5] 
Epoch: 1 |Step: 1 |batch_x: [ 6.  7.  8.  9. 10.] |batch_y [ 3.  3.5 4.  4.5 5. ] 
Epoch: 2 |Step: 0 |batch_x: [ 1. 2. 3. 4. 5.] |batch_y [ 0.5 1.  1.5 2.  2.5] 
Epoch: 2 |Step: 1 |batch_x: [ 6.  7.  8.  9. 10.] |batch_y [ 3.  3.5 4.  4.5 5. ] 
'''

2. TensorDataset

classtorch.utils.data.TensorDataset(data_tensor, target_tensor)

TensorDataset类用来将样本及其标签打包成torch的Dataset，data_tensor,和target_tensor都是tensor。

3. DataLoader

classtorch.utils.data.DataLoader(dataset, batch_size=1, shuffle=False, sampler=None,num_workers=0, collate_fn=<function default_collate>, pin_memory=False,drop_last=False)

dataset就是Torch的Dataset格式的对象；batch_size即每批训练的样本数量，默认为；shuffle表示是否需要随机取样本；num_workers表示读取样本的线程数。

二、PyTorch的Optimizer优化器

本实验中，首先构造一组数据集，转换格式并置于DataLoader中，备用。定义一个固定结构的默认神经网络，然后为每个优化器构建一个神经网络，每个神经网络的区别仅仅是优化器不同。通过记录训练过程中的loss值，最后在图像上呈现得到各个优化器的优化过程。

代码实现：

import torch 
import torch.utils.data as Data 
import torch.nn.functional as F 
from torch.autograd import Variable 
import matplotlib.pyplot as plt 
torch.manual_seed(1) # 设定随机数种子 
 
# 定义超参数 
LR = 0.01 # 学习率 
BATCH_SIZE = 32 # 批大小 
EPOCH = 12 # 迭代次数 
 
x = torch.unsqueeze(torch.linspace(-1, 1, 1000), dim=1) 
y = x.pow(2) + 0.1*torch.normal(torch.zeros(*x.size())) 
 
#plt.scatter(x.numpy(), y.numpy()) 
#plt.show() 
 
# 将数据转换为torch的dataset格式 
torch_dataset = Data.TensorDataset(data_tensor=x, target_tensor=y) 
# 将torch_dataset置入Dataloader中 
loader = Data.DataLoader(dataset=torch_dataset, batch_size=BATCH_SIZE, 
             shuffle=True, num_workers=2) 
 
class Net(torch.nn.Module): 
  def __init__(self): 
    super(Net, self).__init__() 
    self.hidden = torch.nn.Linear(1, 20) 
    self.predict = torch.nn.Linear(20, 1) 
 
  def forward(self, x): 
    x = F.relu(self.hidden(x)) 
    x = self.predict(x) 
    return x 
 
# 为每个优化器创建一个Net 
net_SGD = Net() 
net_Momentum = Net() 
net_RMSprop = Net() 
net_Adam = Net()  
nets = [net_SGD, net_Momentum, net_RMSprop, net_Adam] 
 
# 初始化优化器 
opt_SGD = torch.optim.SGD(net_SGD.parameters(), lr=LR) 
opt_Momentum = torch.optim.SGD(net_Momentum.parameters(), lr=LR, momentum=0.8) 
opt_RMSprop = torch.optim.RMSprop(net_RMSprop.parameters(), lr=LR, alpha=0.9) 
opt_Adam = torch.optim.Adam(net_Adam.parameters(), lr=LR, betas=(0.9, 0.99)) 
 
optimizers = [opt_SGD, opt_Momentum, opt_RMSprop, opt_Adam] 
 
# 定义损失函数 
loss_function = torch.nn.MSELoss() 
losses_history = [[], [], [], []] # 记录training时不同神经网络的loss值 
 
for epoch in range(EPOCH): 
  print('Epoch:', epoch + 1, 'Training...') 
  for step, (batch_x, batch_y) in enumerate(loader): 
    b_x = Variable(batch_x) 
    b_y = Variable(batch_y) 
 
    for net, opt, l_his in zip(nets, optimizers, losses_history): 
      output = net(b_x) 
      loss = loss_function(output, b_y) 
      opt.zero_grad() 
      loss.backward() 
      opt.step() 
      l_his.append(loss.data[0]) 
 
labels = ['SGD', 'Momentum', 'RMSprop', 'Adam'] 
 
for i, l_his in enumerate(losses_history): 
  plt.plot(l_his, label=labels[i]) 
plt.legend(loc='best') 
plt.xlabel('Steps') 
plt.ylabel('Loss') 
plt.ylim((0, 0.2)) 
plt.show()

实验结果：

详解PyTorch批训练及优化器比较

由实验结果可见，SGD的优化效果是最差的，速度很慢；作为SGD的改良版本，Momentum表现就好许多；相比RMSprop和Adam的优化速度就非常好。实验中，针对不同的优化问题，比较各个优化器的效果再来决定使用哪个。

三、其他补充

1. Python的zip函数

zip函数接受任意多个（包括0个和1个）序列作为参数，返回一个tuple列表。

x = [1, 2, 3] 
y = [4, 5, 6] 
z = [7, 8, 9] 
xyz = zip(x, y, z) 
print xyz 
[(1, 4, 7), (2, 5, 8), (3, 6, 9)] 
 
x = [1, 2, 3] 
x = zip(x) 
print x 
[(1,), (2,), (3,)] 
 
x = [1, 2, 3] 
y = [4, 5, 6, 7] 
xy = zip(x, y) 
print xy 
[(1, 4), (2, 5), (3, 6)]

以上就是本文的全部内容，希望对大家的学习有所帮助，也希望大家多多支持三水点靠木。

详解PyTorch批训练及优化器比较

- Author -

marsjhao

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

详解 Python 与文件对象共事的实例

Sep 11 Python

python自动裁剪图像代码分享

Nov 25 Python

python之matplotlib学习绘制动态更新图实例代码

Jan 23 Python

Python3实现取图片中特定的像素替换指定的颜色示例

Jan 24 Python

使用Python制作表情包实现换脸功能

Jul 19 Python

PyCharm无法识别PyQt5的2种解决方法，ModuleNotFoundError: No module named 'pyqt5'

Feb 17 Python

Python图像处理库PIL的ImageFilter模块使用介绍

Feb 26 Python

python数据类型可变不可变知识点总结

Mar 06 Python

Python AutoCAD 系统设置的实现方法

Apr 01 Python

keras实现VGG16 CIFAR10数据集方式

Jul 07 Python

Python中的xlrd模块使用整理

Jun 15 Python

一篇文章弄懂Python关键字、标识符和变量

Jul 15 Python

Python使用matplotlib实现的图像读取、切割裁剪功能示例

Apr 28 #Python

浅谈python日志的配置文件路径问题

Apr 28 #Python

PyTorch上实现卷积神经网络CNN的方法

Apr 28 #Python

python 日志增量抓取实现方法

Apr 28 #Python

Django 使用logging打印日志的实例

Apr 28 #Python

python实现log日志的示例代码

Apr 28 #Python

Python学习笔记之open()函数打开文件路径报错问题

Apr 28 #Python

You might like

解析用PHP读写音频文件信息的详解(支持WMA和MP3)

2013/05/10 PHP

php实现12306余票查询、价格查询示例

2014/04/17 PHP

linux下安装php的memcached客户端

2014/08/03 PHP

PHP观察者模式定义与用法实例分析

2019/03/22 PHP

javascript之函数直接量(function(){})()

2007/06/29 Javascript

可以把编码转换成 gb2312编码lib.UTF8toGB2312.js

2007/08/21 Javascript

jQuery 自动增长的文本输入框实现代码

2010/04/02 Javascript

利用腾讯的ip地址库做ip物理地址定位

2010/07/24 Javascript

扩展js对象数组的OrderByAsc和OrderByDesc方法实现思路

2013/05/17 Javascript

Js实现手机发送验证码时按钮延迟操作

2014/06/20 Javascript

node.js中Socket.IO的进阶使用技巧

2014/11/04 Javascript

JS实现的网页背景闪电闪烁效果代码

2015/10/17 Javascript

Bootstrap打造一个左侧折叠菜单的系统模板(一)

2016/05/17 Javascript

Bootstrap+jfinal退出系统弹出确认框的实现方法

2016/05/30 Javascript

webpack中引用jquery的简单实现

2016/06/08 Javascript

RequireJS多页面应用实例分析

2016/06/29 Javascript

基于jQuery实现淡入淡出效果轮播图

2020/07/31 Javascript

深入理解vue2.0路由如何配置问题

2017/07/18 Javascript

ES6 Proxy实现Vue的变化检测问题

2019/06/11 Javascript

微信小程序全局变量GLOBALDATA的定义和调用过程解析

2019/09/23 Javascript

Vue移动端用淘宝弹性布局lib-flexible插件做适配的方法

2020/05/26 Javascript

小程序自定义圆形进度条

2020/11/17 Javascript

Python利用BeautifulSoup解析Html的方法示例

2017/07/30 Python

浅谈pytorch和Numpy的区别以及相互转换方法

2018/07/26 Python

python 动态生成变量名以及动态获取变量的变量名方法

2019/01/20 Python

python ddt数据驱动最简实例代码

2019/02/22 Python

python垃圾回收机制(GC)原理解析

2019/12/30 Python

python机器学习库xgboost的使用

2020/01/20 Python

Django配置跨域并开发测试接口

2020/11/04 Python

雷曼兄弟的五金店：Lehman’s Hardware Store

2019/04/10 全球购物

公司年会演讲稿范文

2014/01/11 职场文书

新闻学专业个人求职信写作

2014/02/04 职场文书

学校四风对照检查材料

2014/08/28 职场文书

公司领导班子对照检查材料

2014/09/24 职场文书

思想作风建设心得体会

2014/10/22 职场文书

说谎欺骗人检讨书300字

2014/11/18 职场文书