编程 Python

Tensorflow轻松实现XOR运算的方式

Posted in Python onFebruary 03, 2020

对于“XOR”大家应该都不陌生，我们在各种课程中都会遇到，它是一个数学逻辑运算符号，在计算机中表示为“XOR”，在数学中表示为“ Tensorflow轻松实现XOR运算的方式 ”，学名为“异或”，其来源细节就不详细表明了，说白了就是两个a、b两个值做异或运算，若a=b则结果为0，反之为1，即“相同为0，不同为1”.

在计算机早期发展中，逻辑运算广泛应用于电子管中，这一点如果大家学习过微机原理应该会比较熟悉，那么在神经网络中如何实现它呢，早先我们使用的是感知机，可理解为单层神经网络，只有输入层和输出层（在吴恩达老师的系列教程中曾提到过这一点，关于神经网络的层数，至今仍有异议，就是说神经网络的层数到底包不包括输入层，现今多数认定是不包括的，我们常说的N层神经网络指的是隐藏层+输出层），但是感知机是无法实现XOR运算的，简单来说就是XOR是线性不可分的，由于感知机是有输入输出层，无法线性划分XOR区域，于是后来就有了使用多层神经网络来解决这一问题的想法～～

关于多层神经网络实现XOR运算可大致这么理解：

Tensorflow轻松实现XOR运算的方式

两个输入均有两个取值0和1，那么组合起来就有四种可能，即[0，0]、[0，1]、[1，0]、[1，1]，这样就可以通过中间的隐藏层进行异或运算了～

咱们直接步入正题吧，对于此次试验我们只需要一个隐藏层即可，关于神经网络的基础知识建议大家去看一下吴恩达大佬的课程，真的很棒，百看不厌，真正的大佬是在认定学生是绝对小白的前提下去讲解的，所以一般人都能听懂～～接下来的图纯手工操作，可能不是那么准确，但中心思想是没有问题的，我们开始吧：

Tensorflow轻松实现XOR运算的方式

上图是最基本的神经网络示意图，有两个输入x1、x2，一个隐藏层，只有一个神经元，然后有个输出层，这就是最典型的“输入层+隐藏层+输出层”的架构，对于本题目，我们的输入和输出以及整体架构如下图所示：

Tensorflow轻松实现XOR运算的方式

输入量为一个矩阵，0和0异或结果为0，0和1异或结果为1，依次类推，对应我们的目标值为[0，1，1，0],最后之所以用约等号是因为我们的预测值与目标值之间会有一定的偏差，如果训练的好那么这二者之间是无限接近的。

我们直接上全部代码吧，就不分步进行了，以为这个实验本身难度较低，且代码注释很清楚，每一步都很明确，如果大家有什么不理解的可以留言给我，看到必回：

#!/usr/bin/env python 
# -*- coding:utf-8 -*-
 
import numpy as np
import tensorflow as tf
 
#定义输入值与目标值
X=np.array([[0,0],[0,1],[1,0],[1,1]])
Y=np.array([[0],[1],[1],[0]])
 
#定义占位符，从输入或目标中按行取数据
x=tf.placeholder(tf.float32,[None,2])
y=tf.placeholder(tf.float32,[None,1])
 
#初始化权重，使其满足正态分布，w1和w2分别为输入层到隐藏层和隐藏层到输出层的权重矩阵
w1=tf.Variable(tf.random_normal([2,2]))
w2=tf.Variable(tf.random_normal([2,1]))
 
#定义b1和b2，分别为隐藏层和输出层的偏移量
b1=tf.Variable([0.1,0.1])
b2=tf.Variable([0.1])
 
#使用Relu激活函数得到隐藏层的输出值
a=tf.nn.relu(tf.matmul(x,w1)+b1)
 
#输出层不用激活函数，直接获得其值
out=tf.matmul(a,w2)+b2
 
#定义损失函数MSE
loss=tf.reduce_mean(tf.square(out-y))
 
#优化器选择Adam
train=tf.train.AdamOptimizer(0.01).minimize(loss)
 
#开始训练，迭代1001次(方便后边的整数步数显示)
with tf.Session() as session:
  session.run(tf.global_variables_initializer()) #初始化变量
  for i in range(1001):
    session.run(train,feed_dict={x:X,y:Y}) #训练模型
    loss_final=session.run(loss,feed_dict={x:X,y:Y}) #获取损失
    if i%100==0:
      print("step:%d   loss:%2f" % (i,loss_final))
  print("X: %r" % X)
  print("pred_out: %r" % session.run(out,feed_dict={x:X}))

对照第三张图片理解代码更加直观，我们的隐藏层神经元功能就是将输入值和相应权重做矩阵乘法，然后加上偏移量，最后使用激活函数进行非线性转换;而输出层没有用到激活函数，因为本次我们不是进行分类或者其他操作，一般情况下隐藏层使用激活函数Relu，输出层若是分类则用sigmode，当然你也可以不用，本次实验只是单纯地做异或运算，那输出层就不劳驾激活函数了～

对于标准神经元内部的操作可理解为下图：

Tensorflow轻松实现XOR运算的方式

这里的x和w一般写成矩阵形式，因为大多数都是多个输入，而矩阵的乘积要满足一定的条件，这一点属于线代中最基础的部分，大家可以稍微了解一下，这里对设定权重的形状还是很重要的；

看下效果吧：

Tensorflow轻松实现XOR运算的方式

这是我们在学习率为0.1，迭代1001次的条件下得到的结果

然后我们学习率不变，迭代2001次，看效果:

Tensorflow轻松实现XOR运算的方式

没有改进，这就说明不是迭代次数的问题，我们还是保持2001的迭代数，将学习率改为0.01，看效果：

Tensorflow轻松实现XOR运算的方式

完美～～～最后损失降为0了～～一般来说，神经网络中的超参中最重要的就是学习率了，如果损失一直降不下来，我们首先要想到修改学习率，其他的超参次之……

大家可以观察一下我们的预测值，四项分别对应[0,1,1,0],已经是相当接近了……

以上这篇Tensorflow轻松实现XOR运算的方式就是小编分享给大家的全部内容了，希望能给大家一个参考，也希望大家多多支持三水点靠木。

Tensorflow轻松实现XOR运算的方式

- Author -

beyond_LH

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

python实现bitmap数据结构详解

Feb 17 Python

Python中的生成器和yield详细介绍

Jan 09 Python

在Python下利用OpenCV来旋转图像的教程

Apr 16 Python

Python3.4编程实现简单抓取爬虫功能示例

Sep 14 Python

Python变量作用域LEGB用法解析

Feb 04 Python

python3中使用__slots__限定实例属性操作分析

Feb 14 Python

Python序列化pickle模块使用详解

Mar 05 Python

详解Ubuntu环境下部署Django+uwsgi+nginx总结

Apr 02 Python

使用python-Jenkins批量创建及修改jobs操作

May 12 Python

Python如何给你的程序做性能测试

Jul 29 Python

Python实现Canny及Hough算法代码实例解析

Aug 06 Python

Python中np.random.randint()参数详解及用法实例

Sep 23 Python

Tensorflow不支持AVX2指令集的解决方法

Feb 03 #Python

基于Python3.6中的OpenCV实现图片色彩空间的转换

Feb 03 #Python

解决Tensorflow 使用时cpu编译不支持警告的问题

Feb 03 #Python

tensorflow2.0保存和恢复模型3种方法

Feb 03 #Python

详解字符串在Python内部是如何省内存的

Feb 03 #Python

python自动化unittest yaml使用过程解析

Feb 03 #Python

Python类如何定义私有变量

Feb 03 #Python

You might like

提问的智慧(2)

2006/10/09 PHP

PHP获取用户访问IP地址的5种方法

2016/05/16 PHP

php简单读取.vcf格式文件的方法示例

2017/09/02 PHP

JS效率个人经验谈（8-15更新），加入range技巧

2007/01/09 Javascript

项目实践之javascript技巧

2007/12/06 Javascript

一个分享按钮的插件使用介绍（可扩展，内附开发制作流程）

2011/09/19 Javascript

基于OO的动画附加插件,可以实现弹跳、渐隐等动画效果分享

2013/06/24 Javascript

使图片旋转的3种解决方案

2013/11/21 Javascript

Jquery修改页面标题title其它JS失效的解决方法

2014/10/31 Javascript

jquery实现鼠标滑过显示二级下拉菜单效果

2015/08/24 Javascript

js判断当前页面在移动设备还是在PC端中打开

2016/01/06 Javascript

javascript中select下拉框的用法总结

2016/01/07 Javascript

js简单设置与使用cookie的方法

2016/01/22 Javascript

jQuery实现的表头固定效果实例【附完整demo源码下载】

2016/08/01 Javascript

js显示动态时间的方法详解

2016/08/20 Javascript

JavaScript之promise_动力节点Java学院整理

2017/07/03 Javascript

基于 Vue.js 2.0 酷炫自适应背景视频登录页面实现方式

2018/01/17 Javascript

Bootstrap实现可折叠分组侧边导航菜单

2018/03/07 Javascript

python文件比较示例分享

2014/01/10 Python

利用Python获取操作系统信息实例

2016/09/02 Python

python实现的正则表达式功能入门教程【经典】

2017/06/05 Python

Django 创建新App及其常用命令的实现方法

2019/08/04 Python

Python list运算操作代码实例解析

2020/01/20 Python

Python代码中如何读取键盘录入的值

2020/05/27 Python

Python高并发和多线程有什么关系

2020/11/14 Python

美国专业级皮肤病和spa品质护肤品的高级零售网站：SkinCareRx

2017/02/06 全球购物

四方通行旅游网：台湾订房、出国旅游

2017/09/20 全球购物

学年自我鉴定

2014/01/16 职场文书

残疾人创业典型事迹

2014/02/01 职场文书

学习十八大报告感言

2014/02/04 职场文书

2015年会计年终工作总结

2015/05/26 职场文书

拿破仑传读书笔记

2015/07/01 职场文书

2016父亲节感恩话语

2015/12/09 职场文书

2016教师校本研修心得体会

2016/01/08 职场文书

解读MySQL的客户端和服务端协议

2021/05/10 MySQL

Java中的随机数Random

2022/03/17 Java/Android