深度学习小工程练习之垃圾分类详解


Posted in Python onApril 14, 2021

介绍

这是一个基于深度学习的垃圾分类小工程,用深度残差网络构建

软件架构

  1. 使用深度残差网络resnet50作为基石,在后续添加需要的层以适应不同的分类任务
  2. 模型的训练需要用生成器将数据集循环写入内存,同时图像增强以泛化模型
  3. 使用不包含网络输出部分的resnet50权重文件进行迁移学习,只训练我们在5个stage后增加的层

安装教程

  1. 需要的第三方库主要有tensorflow1.x,keras,opencv,Pillow,scikit-learn,numpy
  2. 安装方式很简单,打开terminal,例如:pip install numpy -i https://pypi.tuna.tsinghua.edu.cn/simple
  3. 数据集与权重文件比较大,所以没有上传
  4. 如果环境配置方面有问题或者需要数据集与模型权重文件,可以在评论区说明您的问题,我将远程帮助您

使用说明

  1. 文件夹theory记录了我在本次深度学习中收获的笔记,与模型训练的控制台打印信息
  2. 迁移学习需要的初始权重与模型定义文件resnet50.py放在model
  3. 下训练运行trainNet.py,训练结束会创建models文件夹,并将结果权重garclass.h5写入该文件夹
  4. datagen文件夹下的genit.py用于进行图像预处理以及数据生成器接口
  5. 使用训练好的模型进行垃圾分类,运行Demo.py

结果演示

深度学习小工程练习之垃圾分类详解

cans易拉罐

深度学习小工程练习之垃圾分类详解

代码解释

在实际的模型中,我们只使用了resnet50的5个stage,后面的输出部分需要我们自己定制,网络的结构图如下:

深度学习小工程练习之垃圾分类详解

stage5后我们的定制网络如下:

"""定制resnet后面的层"""
def custom(input_size,num_classes,pretrain):
    # 引入初始化resnet50模型
    base_model = ResNet50(weights=pretrain,
                          include_top=False,
                          pooling=None,
                          input_shape=(input_size,input_size, 3),
                          classes=num_classes)
    #由于有预权重,前部分冻结,后面进行迁移学习
    for layer in base_model.layers:
        layer.trainable = False
    #添加后面的层
    x = base_model.output
    x = layers.GlobalAveragePooling2D(name='avg_pool')(x)
    x = layers.Dropout(0.5,name='dropout1')(x)
    #regularizers正则化层,正则化器允许在优化过程中对层的参数或层的激活情况进行惩罚
    #对损失函数进行最小化的同时,也需要让对参数添加限制,这个限制也就是正则化惩罚项,使用l2范数
    x = layers.Dense(512,activation='relu',kernel_regularizer= regularizers.l2(0.0001),name='fc2')(x)
    x = layers.BatchNormalization(name='bn_fc_01')(x)
    x = layers.Dropout(0.5,name='dropout2')(x)
    #40个分类
    x = layers.Dense(num_classes,activation='softmax')(x)
    model = Model(inputs=base_model.input,outputs=x)
    #模型编译
    model.compile(optimizer="adam",loss = 'categorical_crossentropy',metrics=['accuracy'])
    return model

网络的训练是迁移学习过程,使用已有的初始resnet50权重(5个stage已经训练过,卷积层已经能够提取特征),我们只训练后面的全连接层部分,4个epoch后再对较后面的层进行训练微调一下,获得更高准确率,训练过程如下:

class Net():
    def __init__(self,img_size,gar_num,data_dir,batch_size,pretrain):
        self.img_size=img_size
        self.gar_num=gar_num
        self.data_dir=data_dir
        self.batch_size=batch_size
        self.pretrain=pretrain
    def build_train(self):
        """迁移学习"""
        model = resnet.custom(self.img_size, self.gar_num, self.pretrain)
        model.summary()
        train_sequence, validation_sequence = genit.gendata(self.data_dir, self.batch_size, self.gar_num, self.img_size)
        epochs=4
        model.fit_generator(train_sequence,steps_per_epoch=len(train_sequence),epochs=epochs,verbose=1,validation_data=validation_sequence,
                                     max_queue_size=10,shuffle=True)
        #微调,在实际工程中,激活函数也被算进层里,所以总共181层,微调是为了重新训练部分卷积层,同时训练最后的全连接层
        layers=149
        learning_rate=1e-4
        for layer in model.layers[:layers]:
            layer.trainable = False
        for layer in model.layers[layers:]:
            layer.trainable = True
        Adam =adam(lr=learning_rate, decay=0.0005)
        model.compile(optimizer=Adam, loss='categorical_crossentropy', metrics=['accuracy'])
        model.fit_generator(train_sequence,steps_per_epoch=len(train_sequence),epochs=epochs * 2,verbose=1,
            callbacks=[
                callbacks.ModelCheckpoint('./models/garclass.h5',monitor='val_loss', save_best_only=True, mode='min'),
                callbacks.ReduceLROnPlateau(monitor='val_loss', factor=0.1,patience=10, mode='min'),
                callbacks.EarlyStopping(monitor='val_loss', patience=10),],
            validation_data=validation_sequence,max_queue_size=10,shuffle=True)
        print('finish train,look for garclass.h5')

训练结果如下:

"""
    loss: 0.7949 - acc: 0.9494 - val_loss: 0.9900 - val_acc: 0.8797
    训练用了9小时左右
    """

如果使用更好的显卡,可以更快完成训练

最后

希望大家可以体验到深度学习带来的收获,能和大家学习很开心,更多关于深度学习的资料请关注三水点靠木其它相关文章!

Python 相关文章推荐
Python with的用法
Aug 22 Python
Python单链表的简单实现方法
Sep 23 Python
Linux下将Python的Django项目部署到Apache服务器
Dec 24 Python
python实现C4.5决策树算法
Aug 29 Python
Python matplotlib通过plt.scatter画空心圆标记出特定的点方法
Dec 13 Python
Python3.0中普通方法、类方法和静态方法的比较
May 03 Python
python和c语言的主要区别总结
Jul 07 Python
python django下载大的csv文件实现方法分析
Jul 19 Python
python 实现矩阵填充0的例子
Nov 29 Python
Python OpenCV实现测量图片物体宽度
May 27 Python
matplotlib 三维图表绘制方法简介
Sep 20 Python
Python3+SQLAlchemy+Sqlite3实现ORM教程
Feb 16 Python
python3美化表格数据输出结果的实现代码
Apr 14 #Python
Python生成九宫格图片的示例代码
用Python写一个简易版弹球游戏
python urllib库的使用详解
Apr 13 #Python
用Python将库打包发布到pypi
python xlwt模块的使用解析
python 爬取豆瓣网页的示例
You might like
虚拟主机中对PHP的特殊设置
2006/10/09 PHP
Smarty+QUICKFORM小小演示
2007/02/25 PHP
实用函数7
2007/11/08 PHP
php SQL Injection with MySQL
2011/02/27 PHP
php数组函数序列之array_sum() - 计算数组元素值之和
2011/10/29 PHP
Yii学习总结之数据访问对象 (DAO)
2015/02/22 PHP
Yii输入正确验证码却验证失败的解决方法
2017/06/06 PHP
PHP+JS实现的实时搜索提示功能
2018/03/13 PHP
PHP面向对象程序设计中的self、static、parent关键字用法分析
2019/08/14 PHP
tagName的使用,留一笔
2006/06/26 Javascript
Javascript 二维数组
2009/11/26 Javascript
JS 实现导航栏悬停效果
2013/09/23 Javascript
jQuery解决IE6、7、8不能使用 JSON.stringify 函数的问题
2016/05/31 Javascript
jQuery layui常用方法介绍
2016/07/25 Javascript
基于vuejs+webpack的日期选择插件
2020/05/21 Javascript
Vue+Element实现网页版个人简历系统(推荐)
2019/12/31 Javascript
node 版本切换的实现
2020/02/02 Javascript
使用原生javascript开发计算器实例代码
2021/02/21 Javascript
Python内置函数dir详解
2015/04/14 Python
python 读写、创建 文件的方法(必看)
2016/09/12 Python
详解python中的装饰器
2018/07/10 Python
解决tensorflow测试模型时NotFoundError错误的问题
2018/07/26 Python
Python数据持久化存储实现方法分析
2019/12/21 Python
tensorflow 初始化未初始化的变量实例
2020/02/06 Python
基于python 取余问题(%)详解
2020/06/03 Python
python中元组的用法整理
2020/06/15 Python
GafasWorld西班牙:购买太阳镜、眼镜和隐形眼镜
2019/09/08 全球购物
测试工程师岗位职责
2013/11/28 职场文书
学前班教师的自我鉴定
2013/12/05 职场文书
母亲节演讲稿范文
2014/01/02 职场文书
关于运动会的广播稿(10篇)
2014/09/12 职场文书
医院党的群众路线教育实践活动领导班子对照检查材料
2014/09/25 职场文书
中秋节慰问信
2015/02/15 职场文书
警告通知
2015/04/25 职场文书
2015年领班工作总结
2015/04/29 职场文书
2015年大学班主任工作总结
2015/04/30 职场文书