深度学习小工程练习之垃圾分类详解


Posted in Python onApril 14, 2021

介绍

这是一个基于深度学习的垃圾分类小工程,用深度残差网络构建

软件架构

  1. 使用深度残差网络resnet50作为基石,在后续添加需要的层以适应不同的分类任务
  2. 模型的训练需要用生成器将数据集循环写入内存,同时图像增强以泛化模型
  3. 使用不包含网络输出部分的resnet50权重文件进行迁移学习,只训练我们在5个stage后增加的层

安装教程

  1. 需要的第三方库主要有tensorflow1.x,keras,opencv,Pillow,scikit-learn,numpy
  2. 安装方式很简单,打开terminal,例如:pip install numpy -i https://pypi.tuna.tsinghua.edu.cn/simple
  3. 数据集与权重文件比较大,所以没有上传
  4. 如果环境配置方面有问题或者需要数据集与模型权重文件,可以在评论区说明您的问题,我将远程帮助您

使用说明

  1. 文件夹theory记录了我在本次深度学习中收获的笔记,与模型训练的控制台打印信息
  2. 迁移学习需要的初始权重与模型定义文件resnet50.py放在model
  3. 下训练运行trainNet.py,训练结束会创建models文件夹,并将结果权重garclass.h5写入该文件夹
  4. datagen文件夹下的genit.py用于进行图像预处理以及数据生成器接口
  5. 使用训练好的模型进行垃圾分类,运行Demo.py

结果演示

深度学习小工程练习之垃圾分类详解

cans易拉罐

深度学习小工程练习之垃圾分类详解

代码解释

在实际的模型中,我们只使用了resnet50的5个stage,后面的输出部分需要我们自己定制,网络的结构图如下:

深度学习小工程练习之垃圾分类详解

stage5后我们的定制网络如下:

"""定制resnet后面的层"""
def custom(input_size,num_classes,pretrain):
    # 引入初始化resnet50模型
    base_model = ResNet50(weights=pretrain,
                          include_top=False,
                          pooling=None,
                          input_shape=(input_size,input_size, 3),
                          classes=num_classes)
    #由于有预权重,前部分冻结,后面进行迁移学习
    for layer in base_model.layers:
        layer.trainable = False
    #添加后面的层
    x = base_model.output
    x = layers.GlobalAveragePooling2D(name='avg_pool')(x)
    x = layers.Dropout(0.5,name='dropout1')(x)
    #regularizers正则化层,正则化器允许在优化过程中对层的参数或层的激活情况进行惩罚
    #对损失函数进行最小化的同时,也需要让对参数添加限制,这个限制也就是正则化惩罚项,使用l2范数
    x = layers.Dense(512,activation='relu',kernel_regularizer= regularizers.l2(0.0001),name='fc2')(x)
    x = layers.BatchNormalization(name='bn_fc_01')(x)
    x = layers.Dropout(0.5,name='dropout2')(x)
    #40个分类
    x = layers.Dense(num_classes,activation='softmax')(x)
    model = Model(inputs=base_model.input,outputs=x)
    #模型编译
    model.compile(optimizer="adam",loss = 'categorical_crossentropy',metrics=['accuracy'])
    return model

网络的训练是迁移学习过程,使用已有的初始resnet50权重(5个stage已经训练过,卷积层已经能够提取特征),我们只训练后面的全连接层部分,4个epoch后再对较后面的层进行训练微调一下,获得更高准确率,训练过程如下:

class Net():
    def __init__(self,img_size,gar_num,data_dir,batch_size,pretrain):
        self.img_size=img_size
        self.gar_num=gar_num
        self.data_dir=data_dir
        self.batch_size=batch_size
        self.pretrain=pretrain
    def build_train(self):
        """迁移学习"""
        model = resnet.custom(self.img_size, self.gar_num, self.pretrain)
        model.summary()
        train_sequence, validation_sequence = genit.gendata(self.data_dir, self.batch_size, self.gar_num, self.img_size)
        epochs=4
        model.fit_generator(train_sequence,steps_per_epoch=len(train_sequence),epochs=epochs,verbose=1,validation_data=validation_sequence,
                                     max_queue_size=10,shuffle=True)
        #微调,在实际工程中,激活函数也被算进层里,所以总共181层,微调是为了重新训练部分卷积层,同时训练最后的全连接层
        layers=149
        learning_rate=1e-4
        for layer in model.layers[:layers]:
            layer.trainable = False
        for layer in model.layers[layers:]:
            layer.trainable = True
        Adam =adam(lr=learning_rate, decay=0.0005)
        model.compile(optimizer=Adam, loss='categorical_crossentropy', metrics=['accuracy'])
        model.fit_generator(train_sequence,steps_per_epoch=len(train_sequence),epochs=epochs * 2,verbose=1,
            callbacks=[
                callbacks.ModelCheckpoint('./models/garclass.h5',monitor='val_loss', save_best_only=True, mode='min'),
                callbacks.ReduceLROnPlateau(monitor='val_loss', factor=0.1,patience=10, mode='min'),
                callbacks.EarlyStopping(monitor='val_loss', patience=10),],
            validation_data=validation_sequence,max_queue_size=10,shuffle=True)
        print('finish train,look for garclass.h5')

训练结果如下:

"""
    loss: 0.7949 - acc: 0.9494 - val_loss: 0.9900 - val_acc: 0.8797
    训练用了9小时左右
    """

如果使用更好的显卡,可以更快完成训练

最后

希望大家可以体验到深度学习带来的收获,能和大家学习很开心,更多关于深度学习的资料请关注三水点靠木其它相关文章!

Python 相关文章推荐
python将MongoDB里的ObjectId转换为时间戳的方法
Mar 13 Python
Python线程详解
Jun 24 Python
python with提前退出遇到的坑与解决方案
Jan 05 Python
python opencv 读取图片 返回图片某像素点的b,g,r值的实现方法
Jul 03 Python
Django 路由控制的实现
Jul 17 Python
python代码实现逻辑回归logistic原理
Aug 07 Python
Python 类属性与实例属性,类对象与实例对象用法分析
Sep 20 Python
Python 字节流,字符串,十六进制相互转换实例(binascii,bytes)
May 11 Python
Anaconda3中的Jupyter notebook添加目录插件的实现
May 18 Python
Python logging日志模块 配置文件方式
Jul 12 Python
Pycharm中使用git进行合作开发的教程详解
Nov 17 Python
python spilt()分隔字符串的实现示例
May 21 Python
python3美化表格数据输出结果的实现代码
Apr 14 #Python
Python生成九宫格图片的示例代码
用Python写一个简易版弹球游戏
python urllib库的使用详解
Apr 13 #Python
用Python将库打包发布到pypi
python xlwt模块的使用解析
python 爬取豆瓣网页的示例
You might like
php cookie使用方法学习笔记分享
2013/11/07 PHP
smarty中常用方法实例总结
2015/08/07 PHP
基于php实现随机合并数组并排序(原排序)
2015/11/26 PHP
yii数据库的查询方法
2015/12/28 PHP
javascript 打印内容方法小结
2009/11/04 Javascript
Riot.js 快速的JavaScript单元测试框架
2009/11/09 Javascript
JS 获取select(多选下拉)中所选值的示例代码
2013/08/02 Javascript
JavaScript验证图片类型(扩展名)的函数分享
2014/05/05 Javascript
js中的事件捕捉模型与冒泡模型实例分析
2015/01/10 Javascript
javascript内置对象操作详解
2015/02/04 Javascript
RequireJS使用注意细节
2016/05/15 Javascript
JavaScript判断浏览器对CSS3属性是否支持的多种方法
2016/11/13 Javascript
jquery请求servlet实现ajax异步请求的示例
2017/06/03 jQuery
微信小程序上传图片功能(附后端代码)
2020/06/19 Javascript
vue $set 给数据赋值的实例
2019/11/09 Javascript
ES2020 已定稿,真实场景案例分析
2020/05/25 Javascript
小结Python用fork来创建子进程注意事项
2014/07/03 Python
Python编写屏幕截图程序方法
2015/02/18 Python
Go语言基于Socket编写服务器端与客户端通信的实例
2016/02/19 Python
qpython3 读取安卓lastpass Cookies
2016/06/19 Python
基于python的Tkinter编写登陆注册界面
2017/06/30 Python
python实现用户管理系统
2018/01/10 Python
python实现动态数组的示例代码
2019/07/15 Python
把django中admin后台界面的英文修改为中文显示的方法
2019/07/26 Python
Python使用uuid库生成唯一标识ID
2020/02/12 Python
Python+Dlib+Opencv实现人脸采集并表情判别功能的代码
2020/07/01 Python
python切片作为占位符使用实例讲解
2021/02/17 Python
美国演唱会订票网站:Ticketmaster美国
2017/10/05 全球购物
会话Bean的种类
2013/11/07 面试题
财务管理职业生涯规划范文
2013/12/27 职场文书
八年级英语教学反思
2014/01/09 职场文书
简历中的自我评价怎么写
2014/01/29 职场文书
2014年音乐教师工作总结
2014/12/03 职场文书
2014年纪委工作总结
2014/12/05 职场文书
大学生入党自荐书
2015/03/05 职场文书
Python趣味挑战之实现简易版音乐播放器
2021/05/28 Python