Tensorflow轻松实现XOR运算的方式


Posted in Python onFebruary 03, 2020

对于“XOR”大家应该都不陌生,我们在各种课程中都会遇到,它是一个数学逻辑运算符号,在计算机中表示为“XOR”,在数学中表示为“Tensorflow轻松实现XOR运算的方式”,学名为“异或”,其来源细节就不详细表明了,说白了就是两个a、b两个值做异或运算,若a=b则结果为0,反之为1,即“相同为0,不同为1”.

在计算机早期发展中,逻辑运算广泛应用于电子管中,这一点如果大家学习过微机原理应该会比较熟悉,那么在神经网络中如何实现它呢,早先我们使用的是感知机,可理解为单层神经网络,只有输入层和输出层(在吴恩达老师的系列教程中曾提到过这一点,关于神经网络的层数,至今仍有异议,就是说神经网络的层数到底包不包括输入层,现今多数认定是不包括的,我们常说的N层神经网络指的是隐藏层+输出层),但是感知机是无法实现XOR运算的,简单来说就是XOR是线性不可分的,由于感知机是有输入输出层,无法线性划分XOR区域,于是后来就有了使用多层神经网络来解决这一问题的想法~~

关于多层神经网络实现XOR运算可大致这么理解:

Tensorflow轻松实现XOR运算的方式

两个输入均有两个取值0和1,那么组合起来就有四种可能,即[0,0]、[0,1]、[1,0]、[1,1],这样就可以通过中间的隐藏层进行异或运算了~

咱们直接步入正题吧,对于此次试验我们只需要一个隐藏层即可,关于神经网络 的基础知识建议大家去看一下吴恩达大佬的课程,真的很棒,百看不厌,真正的大佬是在认定学生是绝对小白的前提下去讲解的,所以一般人都能听懂~~接下来的图纯手工操作,可能不是那么准确,但中心思想是没有问题的,我们开始吧:

Tensorflow轻松实现XOR运算的方式

上图是最基本的神经网络示意图,有两个输入x1、x2,一个隐藏层,只有一个神经元,然后有个输出层,这就是最典型的“输入层+隐藏层+输出层”的架构,对于本题目,我们的输入和输出以及整体架构如下图所示:

Tensorflow轻松实现XOR运算的方式

输入量为一个矩阵,0和0异或结果为0,0和1异或结果为1,依次类推,对应我们的目标值为[0,1,1,0],最后之所以用约等号是因为我们的预测值与目标值之间会有一定的偏差,如果训练的好那么这二者之间是无限接近的。

我们直接上全部代码吧,就不分步进行了,以为这个实验本身难度较低,且代码注释很清楚,每一步都很明确,如果大家有什么不理解的可以留言给我,看到必回:

#!/usr/bin/env python 
# -*- coding:utf-8 -*-
 
import numpy as np
import tensorflow as tf
 
#定义输入值与目标值
X=np.array([[0,0],[0,1],[1,0],[1,1]])
Y=np.array([[0],[1],[1],[0]])
 
#定义占位符,从输入或目标中按行取数据
x=tf.placeholder(tf.float32,[None,2])
y=tf.placeholder(tf.float32,[None,1])
 
#初始化权重,使其满足正态分布,w1和w2分别为输入层到隐藏层和隐藏层到输出层的权重矩阵
w1=tf.Variable(tf.random_normal([2,2]))
w2=tf.Variable(tf.random_normal([2,1]))
 
#定义b1和b2,分别为隐藏层和输出层的偏移量
b1=tf.Variable([0.1,0.1])
b2=tf.Variable([0.1])
 
#使用Relu激活函数得到隐藏层的输出值
a=tf.nn.relu(tf.matmul(x,w1)+b1)
 
#输出层不用激活函数,直接获得其值
out=tf.matmul(a,w2)+b2
 
#定义损失函数MSE
loss=tf.reduce_mean(tf.square(out-y))
 
#优化器选择Adam
train=tf.train.AdamOptimizer(0.01).minimize(loss)
 
#开始训练,迭代1001次(方便后边的整数步数显示)
with tf.Session() as session:
  session.run(tf.global_variables_initializer()) #初始化变量
  for i in range(1001):
    session.run(train,feed_dict={x:X,y:Y}) #训练模型
    loss_final=session.run(loss,feed_dict={x:X,y:Y}) #获取损失
    if i%100==0:
      print("step:%d   loss:%2f" % (i,loss_final))
  print("X: %r" % X)
  print("pred_out: %r" % session.run(out,feed_dict={x:X}))

对照第三张图片理解代码更加直观,我们的隐藏层神经元功能就是将输入值和相应权重做矩阵乘法,然后加上偏移量,最后使用激活函数进行非线性转换;而输出层没有用到激活函数,因为本次我们不是进行分类或者其他操作,一般情况下隐藏层使用激活函数Relu,输出层若是分类则用sigmode,当然你也可以不用,本次实验只是单纯地做异或运算,那输出层就不劳驾激活函数了~

对于标准神经元内部的操作可理解为下图:

Tensorflow轻松实现XOR运算的方式

这里的x和w一般写成矩阵形式,因为大多数都是多个输入,而矩阵的乘积要满足一定的条件,这一点属于线代中最基础的部分,大家可以稍微了解一下,这里对设定权重的形状还是很重要的;

看下效果吧:

Tensorflow轻松实现XOR运算的方式

这是我们在学习率为0.1,迭代1001次的条件下得到的结果

然后我们学习率不变,迭代2001次,看效果:

Tensorflow轻松实现XOR运算的方式

没有改进,这就说明不是迭代次数的问题,我们还是保持2001的迭代数,将学习率改为0.01,看效果:

Tensorflow轻松实现XOR运算的方式

完美~~~最后损失降为0了~~一般来说,神经网络中的超参中最重要的就是学习率了,如果损失一直降不下来,我们首先要想到修改学习率,其他的超参次之……

大家可以观察一下我们的预测值,四项分别对应[0,1,1,0],已经是相当接近了……

以上这篇Tensorflow轻松实现XOR运算的方式就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python实现bitmap数据结构详解
Feb 17 Python
Python中的生成器和yield详细介绍
Jan 09 Python
在Python下利用OpenCV来旋转图像的教程
Apr 16 Python
Python3.4编程实现简单抓取爬虫功能示例
Sep 14 Python
Python变量作用域LEGB用法解析
Feb 04 Python
python3中使用__slots__限定实例属性操作分析
Feb 14 Python
Python序列化pickle模块使用详解
Mar 05 Python
详解Ubuntu环境下部署Django+uwsgi+nginx总结
Apr 02 Python
使用python-Jenkins批量创建及修改jobs操作
May 12 Python
Python如何给你的程序做性能测试
Jul 29 Python
Python实现Canny及Hough算法代码实例解析
Aug 06 Python
Python中np.random.randint()参数详解及用法实例
Sep 23 Python
Tensorflow不支持AVX2指令集的解决方法
Feb 03 #Python
基于Python3.6中的OpenCV实现图片色彩空间的转换
Feb 03 #Python
解决Tensorflow 使用时cpu编译不支持警告的问题
Feb 03 #Python
tensorflow2.0保存和恢复模型3种方法
Feb 03 #Python
详解字符串在Python内部是如何省内存的
Feb 03 #Python
python自动化unittest yaml使用过程解析
Feb 03 #Python
Python类如何定义私有变量
Feb 03 #Python
You might like
提问的智慧(2)
2006/10/09 PHP
PHP获取用户访问IP地址的5种方法
2016/05/16 PHP
php简单读取.vcf格式文件的方法示例
2017/09/02 PHP
JS效率个人经验谈(8-15更新),加入range技巧
2007/01/09 Javascript
项目实践之javascript技巧
2007/12/06 Javascript
一个分享按钮的插件使用介绍(可扩展,内附开发制作流程)
2011/09/19 Javascript
基于OO的动画附加插件,可以实现弹跳、渐隐等动画效果 分享
2013/06/24 Javascript
使图片旋转的3种解决方案
2013/11/21 Javascript
Jquery修改页面标题title其它JS失效的解决方法
2014/10/31 Javascript
jquery实现鼠标滑过显示二级下拉菜单效果
2015/08/24 Javascript
js判断当前页面在移动设备还是在PC端中打开
2016/01/06 Javascript
javascript中select下拉框的用法总结
2016/01/07 Javascript
js简单设置与使用cookie的方法
2016/01/22 Javascript
jQuery实现的表头固定效果实例【附完整demo源码下载】
2016/08/01 Javascript
js显示动态时间的方法详解
2016/08/20 Javascript
JavaScript之promise_动力节点Java学院整理
2017/07/03 Javascript
基于 Vue.js 2.0 酷炫自适应背景视频登录页面实现方式
2018/01/17 Javascript
Bootstrap实现可折叠分组侧边导航菜单
2018/03/07 Javascript
python文件比较示例分享
2014/01/10 Python
利用Python获取操作系统信息实例
2016/09/02 Python
python实现的正则表达式功能入门教程【经典】
2017/06/05 Python
Django 创建新App及其常用命令的实现方法
2019/08/04 Python
Python list运算操作代码实例解析
2020/01/20 Python
Python代码中如何读取键盘录入的值
2020/05/27 Python
Python高并发和多线程有什么关系
2020/11/14 Python
美国专业级皮肤病和spa品质护肤品的高级零售网站:SkinCareRx
2017/02/06 全球购物
四方通行旅游网:台湾订房、出国旅游
2017/09/20 全球购物
学年自我鉴定
2014/01/16 职场文书
残疾人创业典型事迹
2014/02/01 职场文书
学习十八大报告感言
2014/02/04 职场文书
2015年会计年终工作总结
2015/05/26 职场文书
拿破仑传读书笔记
2015/07/01 职场文书
2016父亲节感恩话语
2015/12/09 职场文书
2016教师校本研修心得体会
2016/01/08 职场文书
解读MySQL的客户端和服务端协议
2021/05/10 MySQL
Java中的随机数Random
2022/03/17 Java/Android