编程 Python

pytorch + visdom CNN处理自建图片数据集的方法

Posted in Python onJune 04, 2018

环境

系统：win10

cpu：i7-6700HQ

gpu：gtx965m

python : 3.6

pytorch ：0.3

数据下载

来源自Sasank Chilamkurthy 的教程；数据：下载链接。

下载后解压放到项目根目录：

pytorch + visdom CNN处理自建图片数据集的方法

数据集为用来分类蚂蚁和蜜蜂。有大约120个训练图像，每个类有75个验证图像。

数据导入

可以使用 torchvision.datasets.ImageFolder(root,transforms) 模块可以将图片转换为 tensor。

先定义transform：

ata_transforms = {
  'train': transforms.Compose([
    # 随机切成224x224 大小图片 统一图片格式
    transforms.RandomResizedCrop(224),
    # 图像翻转
    transforms.RandomHorizontalFlip(),
    # totensor 归一化(0,255) >> (0,1)  normalize  channel=（channel-mean）/std
    transforms.ToTensor(),
    transforms.Normalize(mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225])
  ]),
  "val" : transforms.Compose([
    # 图片大小缩放 统一图片格式
    transforms.Resize(256),
    # 以中心裁剪
    transforms.CenterCrop(224),
    transforms.ToTensor(),
    transforms.Normalize(mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225])
  ])
}

导入，加载数据：

data_dir = './hymenoptera_data'
# trans data
image_datasets = {x: datasets.ImageFolder(os.path.join(data_dir, x), data_transforms[x]) for x in ['train', 'val']}
# load data
data_loaders = {x: DataLoader(image_datasets[x], batch_size=BATCH_SIZE, shuffle=True) for x in ['train', 'val']}

data_sizes = {x: len(image_datasets[x]) for x in ['train', 'val']}
class_names = image_datasets['train'].classes
print(data_sizes, class_names)

{'train': 244, 'val': 153} ['ants', 'bees']

训练集 244图片，测试集153图片。

可视化部分图片看看，由于visdom支持tensor输入，不用换成numpy，直接用tensor计算即可：

inputs, classes = next(iter(data_loaders['val']))

out = torchvision.utils.make_grid(inputs)
inp = torch.transpose(out, 0, 2)
mean = torch.FloatTensor([0.485, 0.456, 0.406])
std = torch.FloatTensor([0.229, 0.224, 0.225])
inp = std * inp + mean
inp = torch.transpose(inp, 0, 2)
viz.images(inp)

pytorch + visdom CNN处理自建图片数据集的方法

创建CNN

net 根据上一篇的处理cifar10的改了一下规格：

class CNN(nn.Module):
  def __init__(self, in_dim, n_class):
    super(CNN, self).__init__()
    self.cnn = nn.Sequential(
      nn.BatchNorm2d(in_dim),
      nn.ReLU(True),
      nn.Conv2d(in_dim, 16, 7), # 224 >> 218
      nn.BatchNorm2d(16),
      nn.ReLU(inplace=True),
      nn.MaxPool2d(2, 2), # 218 >> 109
      nn.ReLU(True),
      nn.Conv2d(16, 32, 5), # 105
      nn.BatchNorm2d(32),
      nn.ReLU(True),
      nn.Conv2d(32, 64, 5), # 101
      nn.BatchNorm2d(64),
      nn.ReLU(True),
      nn.Conv2d(64, 64, 3, 1, 1),
      nn.BatchNorm2d(64),
      nn.ReLU(True),
      nn.MaxPool2d(2, 2), # 101 >> 50
      nn.Conv2d(64, 128, 3, 1, 1), #
      nn.BatchNorm2d(128),
      nn.ReLU(True),
      nn.MaxPool2d(3), # 50 >> 16
    )
    self.fc = nn.Sequential(
      nn.Linear(128*16*16, 120),
      nn.BatchNorm1d(120),
      nn.ReLU(True),
      nn.Linear(120, n_class))
  def forward(self, x):
    out = self.cnn(x)
    out = self.fc(out.view(-1, 128*16*16))
    return out

# 输入3层rgb ，输出 分类 2    
model = CNN(3, 2)

loss，优化函数：

line = viz.line(Y=np.arange(10))
loss_f = nn.CrossEntropyLoss()
optimizer = optim.SGD(model.parameters(), lr=LR, momentum=0.9)
scheduler = optim.lr_scheduler.StepLR(optimizer, step_size=7, gamma=0.1)

参数：

BATCH_SIZE = 4
LR = 0.001
EPOCHS = 10

运行 10个 epoch 看看：

[9/10] train_loss:0.650|train_acc:0.639|test_loss:0.621|test_acc0.706
[10/10] train_loss:0.645|train_acc:0.627|test_loss:0.654|test_acc0.686
Training complete in 1m 16s
Best val Acc: 0.712418

pytorch + visdom CNN处理自建图片数据集的方法

运行 20个看看：

[19/20] train_loss:0.592|train_acc:0.701|test_loss:0.563|test_acc0.712
[20/20] train_loss:0.564|train_acc:0.721|test_loss:0.571|test_acc0.706
Training complete in 2m 30s
Best val Acc: 0.745098

pytorch + visdom CNN处理自建图片数据集的方法

准确率比较低：只有74.5%

我们使用models 里的 resnet18 运行 10个epoch：

model = torchvision.models.resnet18(True)
num_ftrs = model.fc.in_features
model.fc = nn.Linear(num_ftrs, 2)

[9/10] train_loss:0.621|train_acc:0.652|test_loss:0.588|test_acc0.667
[10/10] train_loss:0.610|train_acc:0.680|test_loss:0.561|test_acc0.667
Training complete in 1m 24s
Best val Acc: 0.686275

效果也很一般，想要短时间内就训练出效果很好的models，我们可以下载训练好的state，在此基础上训练：

model = torchvision.models.resnet18(pretrained=True)
num_ftrs = model.fc.in_features
model.fc = nn.Linear(num_ftrs, 2)

[9/10] train_loss:0.308|train_acc:0.877|test_loss:0.160|test_acc0.941
[10/10] train_loss:0.267|train_acc:0.885|test_loss:0.148|test_acc0.954
Training complete in 1m 25s
Best val Acc: 0.954248

10个epoch直接的到95%的准确率。

pytorch + visdom CNN处理自建图片数据集的方法

示例代码：https://github.com/ffzs/ml_pytorch/blob/master/ml_pytorch_hymenoptera

以上就是本文的全部内容，希望对大家的学习有所帮助，也希望大家多多支持三水点靠木。

pytorch + visdom CNN处理自建图片数据集的方法

- Author -

泛泛之素

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

Python生成验证码实例

Aug 21 Python

Python网络爬虫项目：内容提取器的定义

Oct 25 Python

Python实现的爬虫功能代码

Jun 24 Python

浅谈django rest jwt vue 跨域问题

Oct 26 Python

Python 二叉树的层序建立与三种遍历实现详解

Jul 29 Python

python根据时间获取周数代码实例

Sep 30 Python

python多线程实现代码(模拟银行服务操作流程)

Jan 13 Python

Python @property及getter setter原理详解

Mar 31 Python

Python super()方法原理详解

Mar 31 Python

python3:excel操作之读取数据并返回字典 + 写入的案例

Sep 01 Python

python 获取谷歌浏览器保存的密码

Jan 06 Python

python中%格式表达式实例用法

Jun 18 Python

python验证码识别教程之滑动验证码

Jun 04 #Python

python验证码识别教程之利用投影法、连通域法分割图片

Jun 04 #Python

python验证码识别教程之灰度处理、二值化、降噪与tesserocr识别

Jun 04 #Python

实用自动化运维Python脚本分享

Jun 04 #Python

python中验证码连通域分割的方法详解

Jun 04 #Python

python 匹配url中是否存在IP地址的方法

Jun 04 #Python

Python实现ping指定IP的示例

Jun 04 #Python

You might like

php中利用str_pad函数生成数字递增形式的产品编号

2013/09/30 PHP

thinkphp实现数组分页示例

2014/04/13 PHP

详解PHP中的状态模式编程

2015/08/11 PHP

WordPress开发中短代码的实现及相关函数使用技巧

2016/01/05 PHP

CentOS下搭建PHP环境与WordPress博客程序的全流程总结

2016/05/07 PHP

Yii框架弹出窗口组件CJuiDialog用法分析

2017/01/07 PHP

总结一些PHP中好用但又容易忽略的小知识

2017/06/02 PHP

PHP实现的简单排列组合算法应用示例

2017/06/20 PHP

javascript 选择文件夹对话框(web)

2009/07/07 Javascript

js相册效果代码(点击创建即可)

2013/04/16 Javascript

jqueyr判断checkbox组的选中(示例代码)

2013/11/08 Javascript

javascript在网页中实现读取剪贴板粘贴截图功能

2014/06/07 Javascript

JS中对象与字符串的互相转换详解

2016/05/20 Javascript

JS使用eval()动态创建变量的方法

2016/06/03 Javascript

jquery实现网页定位导航

2016/08/23 Javascript

JavaScript实现瀑布流以及加载效果

2017/02/11 Javascript

jQuery Validate表单验证插件实现代码

2017/06/08 jQuery

js实现简易聊天对话框

2017/08/17 Javascript

layer弹出层自适应高度,垂直水平居中的实现

2019/09/16 Javascript

vue使用svg文件补充-svg放大缩小操作(使用d3.js)

2020/09/22 Javascript

[54:25]Ti4 循环赛第三日LGD vs MOUZ

2014/07/12 DOTA

[01:12]DOTA2 2015年秋季互动指南

2015/11/10 DOTA

python对list中的每个元素进行某种操作的方法

2018/06/29 Python

Python爬虫常用小技巧之设置代理IP

2018/09/13 Python

Django添加KindEditor富文本编辑器的使用

2018/10/24 Python

基于python实现高速视频传输程序

2019/05/05 Python

Keras自定义实现带masking的meanpooling层方式

2020/06/16 Python

香港礼品网站：GiftU eshop

2017/09/01 全球购物

苏格兰领先的多渠道鞋店：Begg Shoes

2019/10/22 全球购物

毕业生个人的自我评价优秀范文

2013/10/03 职场文书

汽车专业毕业生自荐信

2013/11/03 职场文书

酒店总经理职务说明书

2014/02/26 职场文书

2015年九一八事变纪念日演讲稿

2015/03/19 职场文书

论文答辩开场白大全

2015/05/27 职场文书

2016年“六一儿童节”校园广播稿

2015/12/17 职场文书

MySQL数据库表约束讲解

2022/06/21 MySQL