编程 Python

tensorflow基于CNN实战mnist手写识别(小白必看)

Posted in Python onJuly 20, 2020

很荣幸您能看到这篇文章，相信通过标题打开这篇文章的都是对tensorflow感兴趣的，特别是对卷积神经网络在mnist手写识别这个实例感兴趣。不管你是什么基础，我相信，你在看完这篇文章后，都能够完全理解这个实例。这对于神经网络入门的小白来说，简直是再好不过了。

通过这篇文章，你能够学习到

tensorflow一些方法的用法
mnist数据集的使用方法以及下载
CNN卷积神经网络具体python代码实现
CNN卷积神经网络原理
模型训练、模型的保存和载入

Tensorflow实战mnist手写数字识别

关于这个mnist手写数字识别实战，我是跟着某课网上的教学视频跟着写的

需要导入的包

import numpy as np
import tensorflow as tf
from tensorflow.examples.tutorials.mnist import input_data #mnist数据用到的包

下载mnist数据

mnist = input_data.read_data_sets('mnist_data',one_hot=True)

通过这一行代码，就可以将mnist数据集下载到本地文件夹mnist_data目录下，当然，你也可以使用绝对地址下载你想要下载的地方。这里需要注意一点是，如果第一次运行程序，由于需要下载资源的缘故，故需要一段时间，并且下载过程是没有提示的，之后下载成功时才会提示 Success xxxxxx 。另一种方式就是直接去官网下载数据集
mnist官网进去点击就可以直接下载了。

张量的声明

input_x = tf.compat.v1.placeholder(tf.float32,[None,28*28],name='input_x')#图片输入
output_y = tf.compat.v1.placeholder(tf.int32,[None,10],name='output_y')#结果的输出
image = tf.reshape(input_x,[-1,28,28,1])#对input_x进行改变形状，

稍微解释一下
[-1,28,28,1] -1表示不考虑输入图片的数量，28*28是图片的长和宽的像素值，1是通道数量，由于原图片是黑白的，所以通道是1，若是彩色图片，应为3.

取测试图片和标签

test_x = mnist.test.images[:3000]
test_y = mnist.test.labels[:3000]

[:3000]表示从列表下标为0到2999 这些数据
[1:3] 表示列表下标从1到2 这些数据

卷积神经网络第一层卷积层（用最通俗的言语告诉你什么是卷积神经网络）

#第一层卷积
conv1 = tf.layers.conv2d(inputs=image,#输入
  filters=32,#32个过滤器
  kernel_size=[5,5],#过滤器在二维的大小是5*5
  strides=1,#步长是1
  padding='same',#same表示输出的大小不变，因此需要补零
  activation=tf.nn.relu#激活函数
 )#形状[28,28,32]

第二层池化层

pool1 = tf.layers.max_pooling2d(
  inputs=conv1,#第一层卷积后的值
  pool_size=[2,2],#过滤器二维大小2*2
  strides=2 #步长2
)#形状[14,14,32]

第三层卷积层2

conv2 = tf.layers.conv2d(inputs=pool1,
  filters=64,
  kernel_size=[5,5],
  strides=1,
  padding='same',
  activation=tf.nn.relu
)#形状[14,14,64]

第四层池化层2

pool2 = tf.layers.max_pooling2d(
  inputs=conv2,
  pool_size=[2,2],
  strides=2
)#形状[7,7,64]

平坦化

flat = tf.reshape(pool2,[-1,7*7*64])

使用flat.shape 输出的形状为(?, 3136)

1024个神经元的全连接层

dense = tf.layers.dense(inputs=flat,units=1024,activation=tf.nn.relu)

tf.nn.relu 是一种激活函数，目前绝大多数神经网络使用的激活函数是relu

Droupout 防止过拟合

dropout = tf.layers.dropout(inputs=dense,rate=0.5)

就是为了避免训练数据量过大，造成过于模型过于符合数据，泛化能力大大减弱。

10个神经元的全连接层

logits = tf.layers.dense(inputs=dropout,units=10,name="logit_1")

计算误差，使用adam优化器优化误差

#计算误差，使用交叉熵（交叉熵用来衡量真实值和预测值的相似性）
loss = tf.losses.softmax_cross_entropy(onehot_labels=output_y,logits=logits)
#学习率0.001 最小化loss值,adam优化器
train_op = tf.train.AdamOptimizer(learning_rate=0.001).minimize(loss)

计算精度值

accurary = tf.metrics.accuracy(
   labels=tf.argmax(output_y,axis=1),
   predictions=tf.argmax(logits,axis=1),)[1]

创建会话，初始化变量

sess = tf.compat.v1.Session()#创建一个会话
#初始化全局变量和局部变量
init = tf.group(tf.global_variables_initializer(), tf.local_variables_initializer())
sess.run(init)

基本上到这里，这个程序就完成了，不过你也可以在此基础上加上一些数据的输出，使其更容易显示整个训练的过程。
比如我加上了这一段

for i in range(1000):
 #获取以batch_size为大小的一个元组，包含一组图片和标签
 batch = mnist.train.next_batch(50)
 train_loss,train_op_,logits_output = sess.run([loss,train_op,logits],{input_x:batch[0],output_y:batch[1]})
 if i % 100 == 0:
  test_accuracy = sess.run(accurary,{input_x:test_x,output_y:test_y})
  print(("step=%d,Train loss=%.4f,[Test accuracy=%.2f]") \
    % (i, train_loss, test_accuracy))

输出为：

tensorflow基于CNN实战mnist手写识别(小白必看)

完整的代码数据文件我整理到了GitHub 下载地址大家如果觉得可以的话，可以给个⭐

下面就回答一些我在学习过程中的遇到的问题：

【问】如何开始学习tensorflow，小白如何入门？
【答】我的建议是先找到自己感兴趣的点，从这个点出发，通过实践将自己不明白的方法原理通过看官网，看博客，查百度，一一解决。文章开头的那个视频，我认为作为入门还不错，最好再有一本tensorflow相关书籍结合着来。

【问】 CNN卷积神经网络的流程是什么，其中的转化是什么样的？
【答】主要涉及的知识就是数组之间的计算，具体关于我对卷积神经网络的理解，可以参考这篇博客最易懂-CNN卷积神经网络运行原理和流程

【问】训练好的模型如何保存或者直接拿来使用呢？
【答】具体看我的另一篇博客模型的保存和使用也是通过这个例子，教你如何保存模型和使用模型

【问】为什么中间有出现两次卷积层，两次池化层？
【答】这个不是必须的，有的比较复杂的模型需要很多层，每一层都是对上一层特征的提取，只是这个就是比较基本的模型，都是使用两次。初次咱们学习的话，就使用两次就够了，后面学习的知识多了，就可以自己根据实际情况加了。

【问】为什么全连接层有两个，里面的神经元数是固定的吗？
【答】有几个全连接层不是固定的，你就可以理解，这个全连接层就是做最后的收尾工作的，就是将前面几个层所提取到的信息，最后进行汇总并显示，所以，最后一个全连接层的神经元必须是10，由于本次使用的ont-hot （独热码）的形式来表示图片的label，所以最后一个输出的神经元个数必须是10.至于前面的，大家可以尝试多使用几个尝试一下。
【问】one_hot独热码在咱们这个程序中是怎么使用的？
【答】其实我也是头一次听说这个编码（我是小白），举个例子吧。
0:1000000000
1:0100000000
2:0010000000
就是这种

到此这篇关于tensorflow基于CNN实战mnist手写识别(小白必看)的文章就介绍到这了,更多相关tensorflow mnist手写识别内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木！

tensorflow基于CNN实战mnist手写识别(小白必看)

- Author -

梁先森-python数据分析师进阶之路

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

使用Python3编写抓取网页和只抓网页图片的脚本

Aug 20 Python

python正则表达式之对号入座篇

Jul 24 Python

Pycharm以root权限运行脚本的方法

Jan 19 Python

python 梯度法求解函数极值的实例

Jul 10 Python

简单了解Django应用app及分布式路由

Jul 24 Python

基于Python的图像数据增强Data Augmentation解析

Aug 13 Python

用python求一重积分和二重积分的例子

Dec 06 Python

Python龙贝格法求积分实例

Feb 29 Python

python如何保存文本文件

Jun 07 Python

Python+Selenium随机生成手机验证码并检查页面上是否弹出重复手机号码提示框

Sep 21 Python

python+selenium实现12306模拟登录的步骤

Jan 21 Python

python3 hdf5文件遍历代码

May 19 Python

基于python实现生成指定大小txt文档

Jul 20 #Python

python中upper是做什么用的

Jul 20 #Python

Pytorch框架实现mnist手写库识别（与tensorflow对比）

Jul 20 #Python

python集合能干吗

Jul 19 #Python

python如何建立全零数组

Jul 19 #Python

解决python中0x80072ee2错误的方法

Jul 19 #Python

python给视频添加背景音乐并改变音量的具体方法

Jul 19 #Python

You might like

PHP autoload与spl_autoload自动加载机制的深入理解

2013/06/05 PHP

PHP fastcgi模式上传大文件(大约有300多K)报错

2014/09/28 PHP

用js来刷新当前页面保留参数的具体实现

2013/12/23 Javascript

checkbox选中与未选中判断示例

2014/08/04 Javascript

快速掌握WordPress中加载JavaScript脚本的方法

2015/12/17 Javascript

基于jQuery实现表格内容的筛选功能

2016/08/21 Javascript

ES6新特性二：Iterator(遍历器)和for-of循环详解

2017/04/20 Javascript

深入解析Vue 组件命名那些事

2017/07/18 Javascript

使用npm安装最新版本nodejs

2018/01/18 NodeJs

JavaScript设计模式之缓存代理模式原理与简单用法示例

2018/08/07 Javascript

Vue CLI3创建项目部署到Tomcat 使用ngrok映射到外网

2019/05/16 Javascript

vue项目中mock.js的使用及基本用法

2019/05/22 Javascript

JS简单表单验证功能完整示例

2020/01/26 Javascript

jquery实现淡入淡出轮播图效果

2020/12/13 jQuery

各个系统下的Python解释器相关安装方法

2015/10/12 Python

简单掌握Python的Collections模块中counter结构的用法

2016/07/07 Python

django上传图片并生成缩略图方法示例

2017/12/11 Python

浅谈numpy数组的几种排序方式

2017/12/15 Python

详解python中的线程与线程池

2019/05/10 Python

利用rest framework搭建Django API过程解析

2019/08/31 Python

在keras中获取某一层上的feature map实例

2020/01/24 Python

基于Python3.6中的OpenCV实现图片色彩空间的转换

2020/02/03 Python

Python如何安装第三方模块

2020/05/28 Python

利用python绘制中国地图（含省界、河流等）

2020/09/21 Python

基于python模拟bfs和dfs代码实例

2020/11/19 Python

如何用python开发Zeroc Ice应用

2021/01/29 Python

一款纯css3实现的圆形旋转分享按钮旋转角度可自己调整

2014/09/02 HTML / CSS

阿迪达斯德国官方网站：adidas德国

2017/07/12 全球购物

Love, Bonito国际官网：新加坡女装品牌

2021/03/13 全球购物

AJAX的优缺点都有什么

2015/08/18 面试题

毕业实习个人鉴定范文

2013/12/10 职场文书

党组织公开承诺书

2014/03/29 职场文书

国博复兴之路观后感

2015/06/02 职场文书

事业单位工作人员2015年度思想工作总结

2015/10/15 职场文书

小程序教您怎样你零成本推广获取数万用户的方法

2019/07/30 职场文书

Python time库的时间时钟处理

2021/05/02 Python