编程 Python

使用TensorFlow实现二分类的方法示例

Posted in Python onFebruary 05, 2019

使用TensorFlow构建一个神经网络来实现二分类，主要包括输入数据格式、隐藏层数的定义、损失函数的选择、优化函数的选择、输出层。下面通过numpy来随机生成一组数据，通过定义一种正负样本的区别，通过TensorFlow来构造一个神经网络来实现二分类。

一、神经网络结构

输入数据：定义输入一个二维数组（x1,x2），数据通过numpy来随机产生，将输出定义为0或1，如果x1+x2<1,则y为1，否则y为0。

隐藏层：定义两层隐藏层，隐藏层的参数为(2,3)，两行三列的矩阵，输入数据通过隐藏层之后，输出的数据为(1,3)，t通过矩阵之间的乘法运算可以获得输出数据。

损失函数：使用交叉熵作为神经网络的损失函数，常用的损失函数还有平方差。

优化函数：通过优化函数来使得损失函数最小化，这里采用的是Adadelta算法进行优化，常用的还有梯度下降算法。

输出数据：将隐藏层的输出数据通过（3,1）的参数，输出一个一维向量，值的大小为0或1。

使用TensorFlow实现二分类的方法示例

二、TensorFlow代码的实现

import tensorflow as tf
from numpy.random import RandomState
 
if __name__ == "__main__":
  #定义每次训练数据batch的大小为8，防止内存溢出
  batch_size = 8
  #定义神经网络的参数
  w1 = tf.Variable(tf.random_normal([2,3],stddev=1,seed=1))
  w2 = tf.Variable(tf.random_normal([3,1],stddev=1,seed=1))
  #定义输入和输出
  x = tf.placeholder(tf.float32,shape=(None,2),name="x-input")
  y_ = tf.placeholder(tf.float32,shape=(None,1),name="y-input")
  #定义神经网络的前向传播过程
  a = tf.matmul(x,w1)
  y = tf.matmul(a,w2)
  #定义损失函数和反向传播算法
  #使用交叉熵作为损失函数
  #tf.clip_by_value(t, clip_value_min, clip_value_max,name=None)
  #基于min和max对张量t进行截断操作，为了应对梯度爆发或者梯度消失的情况
  cross_entropy = -tf.reduce_mean(y_ * tf.log(tf.clip_by_value(y,1e-10,1.0)))
  # 使用Adadelta算法作为优化函数，来保证预测值与实际值之间交叉熵最小
  train_step = tf.train.AdamOptimizer(0.001).minimize(cross_entropy)
  #通过随机函数生成一个模拟数据集
  rdm = RandomState(1)
  # 定义数据集的大小
  dataset_size = 128
  # 模拟输入是一个二维数组
  X = rdm.rand(dataset_size,2)
  #定义输出值，将x1+x2 < 1的输入数据定义为正样本
  Y = [[int(x1+x2 < 1)] for (x1,x2) in X]
  #创建会话运行TensorFlow程序
  with tf.Session() as sess:
    #初始化变量 tf.initialize_all_variables()
    init = tf.initialize_all_variables()
    sess.run(init)
    #设置神经网络的迭代次数
    steps = 5000
    for i in range(steps):
      #每次选取batch_size个样本进行训练
      start = (i * batch_size) % dataset_size
      end = min(start + batch_size,dataset_size)
      #通过选取样本训练神经网络并更新参数
      sess.run(train_step,feed_dict={x:X[start:end],y_:Y[start:end]})
      #每迭代1000次输出一次日志信息
      if i % 1000 == 0 :
        # 计算所有数据的交叉熵
        total_cross_entropy = sess.run(cross_entropy,feed_dict={x:X,y_:Y})
        # 输出交叉熵之和
        print("After %d training step(s),cross entropy on all data is %g"%(i,total_cross_entropy))
    #输出参数w1
    print(w1.eval(session=sess))
    #输出参数w2
    print(w2.eval(session=sess))
    '''
    After 0 training step(s),cross entropy on all data is 0.0674925
    After 1000 training step(s),cross entropy on all data is 0.0163385
    After 2000 training step(s),cross entropy on all data is 0.00907547
    After 3000 training step(s),cross entropy on all data is 0.00714436
    After 4000 training step(s),cross entropy on all data is 0.00578471
    [[-1.96182752 2.58235407 1.68203771]
     [-3.46817183 1.06982315 2.11788988]]
    [[-1.82471502]
     [ 2.68546653]
     [ 1.41819501]]
    '''

上面的TensorFlow二分类我是参考Google深度学习框架，al_kk评论说这个损失函数的定义存在问题，之前没有仔细的去考虑这个问题，al_kk提醒之后，我发现这个损失函数的定义的确存在问题，经过测试发现这个模型也存在一些问题。其实，我们的主要目的是想去学习一个x1+x2=1的直线，来区分0和1两类不同的类别，下面我对这个模型进行了一些修改并说明一下为什么这个损失函数的定义存在问题。

一、为什么说这个损失函数的定义存在问题呢？

上面程序中定义的输入的y的shape为[1]，也就是y的类别为0或1，对于单分类问题交叉熵损失函数的定义应该为

使用TensorFlow实现二分类的方法示例

其中n为y的种类，在上面的例子中需要包含0和1的y_*log(y)(y_表示真实类别，y表示预测类别)，而上面的例子中只包含了一个y_*log(y)，在上例中正确的损失函数定义应该为loss = y_*log(y) + (1-y_) * log(1-y)。为了便于大家理解，我引用al_kk：“如果只有一个类别的交叉熵即y_ * log(y)，如果真实类别y_为0，那么无论预测值y为任何值的时候，损失函数始终为0”。除此之外，大家可以想一下，当预测值始终为1的时候，那么损失函数是不是就会一直为0，这也是为什么输出预测值y的时候，y的值都是大于1的。如果将y的shape改为[2]的话，就可以使用y_*log(y)。

二、修改之后的二分类程序

import tensorflow as tf
import numpy as np
from numpy.random import RandomState
import matplotlib.pyplot as plt
 
if __name__ == "__main__":
  #定义神经网络的参数
  w = tf.Variable(tf.random_normal([2,1],stddev=1,seed=1))
  b = tf.Variable(tf.random_normal([1],stddev=1,seed=1))
  #定义输入和输出
  x = tf.placeholder(tf.float32,shape=(None,2),name="x-input")
  y_ = tf.placeholder(tf.float32,shape=(None,1),name="y-input")
  #定义神经网络的前向传播过程
  y = tf.nn.sigmoid(tf.matmul(x,w) + b)
  #基于min和max对张量t进行截断操作，为了应对梯度爆发或者梯度消失的情况
  cross_entropy = -tf.reduce_mean(y_ * tf.log(tf.clip_by_value(y,1e-10,1.0))+(1-y_) * tf.log(tf.clip_by_value(1-y,1e-10,1.0)))
  # 使用Adadelta算法作为优化函数，来保证预测值与实际值之间交叉熵最小
  train_step = tf.train.AdamOptimizer(0.01).minimize(cross_entropy)
  #通过随机函数生成一个模拟数据集
  rdm = RandomState(1)
  # 定义数据集的大小
  dataset_size = 100
  # 模拟输入是一个二维数组
  X = rdm.rand(dataset_size,2)
  #定义输出值，将x1+x2 < 1的输入数据定义为正样本
  Y = [[int(x1+x2 < 1)] for (x1,x2) in X]
  #创建会话运行TensorFlow程序
  with tf.Session() as sess:
    #初始化变量 tf.initialize_all_variables()
    init = tf.initialize_all_variables()
    sess.run(init)
    #设置神经网络的迭代次数
    steps = 500
    for i in range(steps):
      #通过选取样本训练神经网络并更新参数
      for (input_x,input_y) in zip(X,Y):
        input_x = np.reshape(input_x,(1,2))
        input_y = np.reshape(input_y,(1,1))
        sess.run(train_step,feed_dict={x:input_x,y_:input_y})
      #每迭代1000次输出一次日志信息
      if i % 100 == 0:
        # 计算所有数据的交叉熵
        total_cross_entropy = sess.run(cross_entropy,feed_dict={x:X,y_:Y})
        # 输出交叉熵之和
        print("After %d training step(s),cross entropy on all data is %g"%(i,total_cross_entropy))
    #预测输入X的类别
    pred_Y = sess.run(y,feed_dict={x:X})
    index = 1
    for pred,real in zip(pred_Y,Y):
      print(pred,real)

使用TensorFlow实现二分类的方法示例

以上就是本文的全部内容，希望对大家的学习有所帮助，也希望大家多多支持三水点靠木。

使用TensorFlow实现二分类的方法示例

- Author -

修炼之路

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

跟老齐学Python之坑爹的字符编码

Sep 28 Python

python同时给两个收件人发送邮件的方法

Apr 30 Python

Python中最大最小赋值小技巧(分享)

Dec 23 Python

教你用Python创建微信聊天机器人

Mar 31 Python

python实现ID3决策树算法

Aug 29 Python

对Python实现累加函数的方法详解

Jan 23 Python

Python实现京东秒杀功能代码

May 16 Python

python 杀死自身进程的实现方法

Jul 01 Python

Python 读取有公式cell的结果内容实例方法

Feb 17 Python

Python实现常见的几种加密算法(MD5，SHA-1，HMAC，DES/AES，RSA和ECC)

May 09 Python

利用Python如何制作贪吃蛇及AI版贪吃蛇详解

Aug 24 Python

Python装饰器详细介绍

Mar 25 Python

Tensorflow分类器项目自定义数据读入的实现

Feb 05 #Python

在Python 字典中一键对应多个值的实例

Feb 03 #Python

Django csrf 两种方法设置form的实例

Feb 03 #Python

解决django前后端分离csrf验证的问题

Feb 03 #Python

Python利用heapq实现一个优先级队列的方法

Feb 03 #Python

对Python3中dict.keys()转换成list类型的方法详解

Feb 03 #Python

对python中字典keys,values,items的使用详解

Feb 03 #Python

You might like

zf框架db类的分页示例分享

2014/03/14 PHP

完美解决thinkphp验证码出错无法显示的方法

2014/12/09 PHP

PHP strip_tags() 去字符串中的 HTML、XML 以及 PHP 标签的函数

2016/05/22 PHP

jQuery 行背景颜色的交替显示(隔行变色)实现代码

2009/12/13 Javascript

jQuery.Validate 使用笔记(jQuery Validation范例 )

2010/06/25 Javascript

JavaScript动态修改背景颜色的方法

2015/04/16 Javascript

jQuery实现的选择商品飞入文本框动画效果完整实例

2016/08/10 Javascript

JavaScript中英文字符长度统计方法示例【按照中文占2个字符】

2017/01/17 Javascript

JS原型与原型链的深入理解

2017/02/15 Javascript

JavaScript实现的仿新浪微博原生态输入字数即时检查功能【兼容IE6】

2017/09/26 Javascript

Angular.js实现获取验证码倒计时60秒按钮的简单方法

2017/10/18 Javascript

基于layui数据表格以及传数据的方式

2018/08/19 Javascript

JavaScript如何使用插值实现图像渐变

2020/06/28 Javascript

Vue3不支持Filters过滤器的问题

2020/09/24 Javascript

Node.js 中如何收集和解析命令行参数

2021/01/08 Javascript

详解Python操作RabbitMQ服务器消息队列的远程结果返回

2016/06/30 Python

Python反爬虫技术之防止IP地址被封杀的讲解

2019/01/09 Python

Python读取xlsx文件的实现方法

2019/07/04 Python

python实现图片压缩代码实例

2019/08/12 Python

Python多线程获取返回值代码实例

2020/02/17 Python

Python基于DB-API操作MySQL数据库过程解析

2020/04/23 Python

Django form表单与请求的生命周期步骤详解

2020/06/07 Python

浅析Python打包时包含静态文件处理方法

2021/01/15 Python

如何使用html5与css3完成google涂鸦动画

2012/12/16 HTML / CSS

HTML5 canvas实现移动端上传头像拖拽裁剪效果

2016/03/14 HTML / CSS

翻新二手苹果产品的网络领导者：Mac of all Trades

2017/12/19 全球购物

Spongelle官网：美国的创意护肤洗护品牌

2019/05/15 全球购物

＂引用＂与多态的关系

2013/02/01 面试题

使用Vue.js和MJML创建响应式电子邮件

2021/03/23 Vue.js

超级搞笑检讨书

2014/01/15 职场文书

高一地理教学反思

2014/01/18 职场文书

购房委托书范本

2014/09/18 职场文书

CSS3鼠标悬浮过渡缩放效果

2021/04/17 HTML / CSS

关于Spring配置文件加载方式变化引发的异常详解

2022/01/18 Java/Android

python接口测试返回数据为字典取值方式

2022/02/12 Python

Redis 的查询很快的原因解析及Redis 如何保证查询的高效

2022/03/16 Redis