编程 Python

PyTorch上实现卷积神经网络CNN的方法

Posted in Python onApril 28, 2018

一、卷积神经网络

卷积神经网络（ConvolutionalNeuralNetwork，CNN）最初是为解决图像识别等问题设计的，CNN现在的应用已经不限于图像和视频，也可用于时间序列信号，比如音频信号和文本数据等。CNN作为一个深度学习架构被提出的最初诉求是降低对图像数据预处理的要求，避免复杂的特征工程。在卷积神经网络中，第一个卷积层会直接接受图像像素级的输入，每一层卷积（滤波器）都会提取数据中最有效的特征，这种方法可以提取到图像中最基础的特征，而后再进行组合和抽象形成更高阶的特征，因此CNN在理论上具有对图像缩放、平移和旋转的不变性。

卷积神经网络CNN的要点就是局部连接（LocalConnection）、权值共享（WeightsSharing）和池化层（Pooling）中的降采样（Down-Sampling）。其中，局部连接和权值共享降低了参数量，使训练复杂度大大下降并减轻了过拟合。同时权值共享还赋予了卷积网络对平移的容忍性，池化层降采样则进一步降低了输出参数量并赋予模型对轻度形变的容忍性，提高了模型的泛化能力。可以把卷积层卷积操作理解为用少量参数在图像的多个位置上提取相似特征的过程。

二、代码实现

import torch 
import torch.nn as nn 
from torch.autograd import Variable 
import torch.utils.data as Data 
import torchvision 
import matplotlib.pyplot as plt 
 
torch.manual_seed(1) 
 
EPOCH = 1 
BATCH_SIZE = 50 
LR = 0.001 
DOWNLOAD_MNIST = True 
 
# 获取训练集dataset 
training_data = torchvision.datasets.MNIST( 
       root='./mnist/', # dataset存储路径 
       train=True, # True表示是train训练集，False表示test测试集 
       transform=torchvision.transforms.ToTensor(), # 将原数据规范化到（0,1）区间 
       download=DOWNLOAD_MNIST, 
       ) 
 
# 打印MNIST数据集的训练集及测试集的尺寸 
print(training_data.train_data.size()) 
print(training_data.train_labels.size()) 
# torch.Size([60000, 28, 28]) 
# torch.Size([60000]) 
 
plt.imshow(training_data.train_data[0].numpy(), cmap='gray') 
plt.title('%i' % training_data.train_labels[0]) 
plt.show() 
 
# 通过torchvision.datasets获取的dataset格式可直接可置于DataLoader 
train_loader = Data.DataLoader(dataset=training_data, batch_size=BATCH_SIZE, 
                shuffle=True) 
 
# 获取测试集dataset 
test_data = torchvision.datasets.MNIST(root='./mnist/', train=False) 
# 取前2000个测试集样本 
test_x = Variable(torch.unsqueeze(test_data.test_data, dim=1), 
         volatile=True).type(torch.FloatTensor)[:2000]/255 
# (2000, 28, 28) to (2000, 1, 28, 28), in range(0,1) 
test_y = test_data.test_labels[:2000] 
 
class CNN(nn.Module): 
  def __init__(self): 
    super(CNN, self).__init__() 
    self.conv1 = nn.Sequential( # (1,28,28) 
           nn.Conv2d(in_channels=1, out_channels=16, kernel_size=5, 
                stride=1, padding=2), # (16,28,28) 
    # 想要con2d卷积出来的图片尺寸没有变化, padding=(kernel_size-1)/2 
           nn.ReLU(), 
           nn.MaxPool2d(kernel_size=2) # (16,14,14) 
           ) 
    self.conv2 = nn.Sequential( # (16,14,14) 
           nn.Conv2d(16, 32, 5, 1, 2), # (32,14,14) 
           nn.ReLU(), 
           nn.MaxPool2d(2) # (32,7,7) 
           ) 
    self.out = nn.Linear(32*7*7, 10) 
 
  def forward(self, x): 
    x = self.conv1(x) 
    x = self.conv2(x) 
    x = x.view(x.size(0), -1) # 将（batch，32,7,7）展平为（batch，32*7*7） 
    output = self.out(x) 
    return output 
 
cnn = CNN() 
print(cnn) 
''''' 
CNN ( 
 (conv1): Sequential ( 
  (0): Conv2d(1, 16, kernel_size=(5, 5), stride=(1, 1), padding=(2, 2)) 
  (1): ReLU () 
  (2): MaxPool2d (size=(2, 2), stride=(2, 2), dilation=(1, 1)) 
 ) 
 (conv2): Sequential ( 
  (0): Conv2d(16, 32, kernel_size=(5, 5), stride=(1, 1), padding=(2, 2)) 
  (1): ReLU () 
  (2): MaxPool2d (size=(2, 2), stride=(2, 2), dilation=(1, 1)) 
 ) 
 (out): Linear (1568 -> 10) 
) 
''' 
optimizer = torch.optim.Adam(cnn.parameters(), lr=LR) 
loss_function = nn.CrossEntropyLoss() 
 
for epoch in range(EPOCH): 
  for step, (x, y) in enumerate(train_loader): 
    b_x = Variable(x) 
    b_y = Variable(y) 
 
    output = cnn(b_x) 
    loss = loss_function(output, b_y) 
    optimizer.zero_grad() 
    loss.backward() 
    optimizer.step() 
 
    if step % 100 == 0: 
      test_output = cnn(test_x) 
      pred_y = torch.max(test_output, 1)[1].data.squeeze() 
      accuracy = sum(pred_y == test_y) / test_y.size(0) 
      print('Epoch:', epoch, '|Step:', step, 
         '|train loss:%.4f'%loss.data[0], '|test accuracy:%.4f'%accuracy) 
 
test_output = cnn(test_x[:10]) 
pred_y = torch.max(test_output, 1)[1].data.numpy().squeeze() 
print(pred_y, 'prediction number') 
print(test_y[:10].numpy(), 'real number') 
''''' 
Epoch: 0 |Step: 0 |train loss:2.3145 |test accuracy:0.1040 
Epoch: 0 |Step: 100 |train loss:0.5857 |test accuracy:0.8865 
Epoch: 0 |Step: 200 |train loss:0.0600 |test accuracy:0.9380 
Epoch: 0 |Step: 300 |train loss:0.0996 |test accuracy:0.9345 
Epoch: 0 |Step: 400 |train loss:0.0381 |test accuracy:0.9645 
Epoch: 0 |Step: 500 |train loss:0.0266 |test accuracy:0.9620 
Epoch: 0 |Step: 600 |train loss:0.0973 |test accuracy:0.9685 
Epoch: 0 |Step: 700 |train loss:0.0421 |test accuracy:0.9725 
Epoch: 0 |Step: 800 |train loss:0.0654 |test accuracy:0.9710 
Epoch: 0 |Step: 900 |train loss:0.1333 |test accuracy:0.9740 
Epoch: 0 |Step: 1000 |train loss:0.0289 |test accuracy:0.9720 
Epoch: 0 |Step: 1100 |train loss:0.0429 |test accuracy:0.9770 
[7 2 1 0 4 1 4 9 5 9] prediction number 
[7 2 1 0 4 1 4 9 5 9] real number 
'''

三、分析解读

通过利用torchvision.datasets可以快速获取可以直接置于DataLoader中的dataset格式的数据，通过train参数控制是获取训练数据集还是测试数据集，也可以在获取的时候便直接转换成训练所需的数据格式。

卷积神经网络的搭建通过定义一个CNN类来实现，卷积层conv1，conv2及out层以类属性的形式定义，各层之间的衔接信息在forward中定义，定义的时候要留意各层的神经元数量。

CNN的网络结构如下：

CNN (

 (conv1): Sequential (

  (0): Conv2d(1, 16,kernel_size=(5, 5), stride=(1, 1), padding=(2, 2))

  (1): ReLU ()

  (2): MaxPool2d (size=(2,2), stride=(2, 2), dilation=(1, 1))

 )

 (conv2): Sequential (

  (0): Conv2d(16, 32,kernel_size=(5, 5), stride=(1, 1), padding=(2, 2))

  (1): ReLU ()

  (2): MaxPool2d (size=(2,2), stride=(2, 2), dilation=(1, 1))

 )

 (out): Linear (1568 ->10)

)

经过实验可见，在EPOCH=1的训练结果中，测试集准确率可达到97.7%。

以上就是本文的全部内容，希望对大家的学习有所帮助，也希望大家多多支持三水点靠木。

PyTorch上实现卷积神经网络CNN的方法

- Author -

https://blog.csdn.net/marsjhao/article/details/72179517

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

Python 命令行参数sys.argv

Sep 06 Python

在Python中使用异步Socket编程性能测试

Jun 25 Python

Windows系统下多版本pip的共存问题详解

Oct 10 Python

运行django项目指定IP和端口的方法

May 14 Python

Python计算一个给定时间点前一个月和后一个月第一天的方法

May 29 Python

Python单元和文档测试实例详解

Apr 11 Python

Python 脚本的三种执行方式小结

Dec 21 Python

在pytorch中对非叶节点的变量计算梯度实例

Jan 10 Python

python高级特性简介

Aug 13 Python

python 动态绘制爱心的示例

Sep 27 Python

python 基于selenium实现鼠标拖拽功能

Dec 24 Python

python3.7.2 tkinter entry框限定输入数字的操作

May 22 Python

python 日志增量抓取实现方法

Apr 28 #Python

Django 使用logging打印日志的实例

Apr 28 #Python

python实现log日志的示例代码

Apr 28 #Python

Python学习笔记之open()函数打开文件路径报错问题

Apr 28 #Python

Python之读取TXT文件的方法小结

Apr 27 #Python

如何利用python查找电脑文件

Apr 27 #Python

Python3 中把txt数据文件读入到矩阵中的方法

Apr 27 #Python

You might like

Protoss魔法科技

2020/03/14 星际争霸

php调用nginx的mod_zip模块打包ZIP文件

2014/06/11 PHP

laravel5.1框架model类查询的实现方法

2019/10/08 PHP

js 图片缩放（按比例）控制代码

2009/05/27 Javascript

javascript 面向对象全新理练之数据的封装

2009/12/03 Javascript

jquery插件珍藏(图片局部放大/信息提示框)

2013/01/08 Javascript

jQuery动态显示和隐藏datagrid中的某一列的方法

2013/12/11 Javascript

如何获取网站icon有哪些可行的方法

2014/06/05 Javascript

jQuery操作JSON的CRUD用法实例

2015/02/25 Javascript

CSS+JS实现点击文字弹出定时自动关闭DIV层菜单的方法

2015/05/12 Javascript

jQuery中的一些常见方法小结(推荐)

2016/06/13 Javascript

12 款 JS 代码测试必备工具(翻译)

2016/12/13 Javascript

浅谈angularjs $http提交数据探索

2017/01/20 Javascript

微信小程序实现点击返回顶层的方法

2017/07/12 Javascript

在iframe中使bootstrap的模态框在父页面弹出问题

2017/08/07 Javascript

vue后台管理之动态加载路由的方法

2018/08/13 Javascript

在博客园博文中添加自定义右键菜单的方法详解

2020/02/05 Javascript

electron踩坑之remote of undefined的解决

2020/10/06 Javascript

[36:22]VP vs Serenity 2018国际邀请赛小组赛BO2 第一场 8.16

2018/08/17 DOTA

Python制作CSDN免积分下载器

2015/03/10 Python

python3大文件解压和基本操作

2017/12/15 Python

python解决字符串倒序输出的问题

2018/06/25 Python

python使用插值法画出平滑曲线

2018/12/15 Python

PyCharm在新窗口打开项目的方法

2019/01/17 Python

为什么称python为胶水语言

2020/06/16 Python

python 利用zmail库发送邮件

2020/09/11 Python

Hotels.com中国区：好订网

2016/08/18 全球购物

中国旅游网站：同程旅游

2016/09/11 全球购物

意大利值得信赖的在线超级药房：PillolaStore

2020/02/05 全球购物

《中彩那天》教学反思

2014/02/22 职场文书

办理信用卡工作证明

2014/09/30 职场文书

行政经理岗位职责

2015/04/15 职场文书

房屋维修申请报告

2015/05/18 职场文书

初中同学会致辞

2015/08/01 职场文书

干货：如何写好工作总结报告！

2019/05/10 职场文书

Nginx 负载均衡是什么以及该如何配置

2021/03/31 Servers