关于tensorflow softmax函数用法解析


Posted in Python onJune 30, 2020

如下所示:

def softmax(logits, axis=None, name=None, dim=None):
 """Computes softmax activations.
 This function performs the equivalent of
  softmax = tf.exp(logits) / tf.reduce_sum(tf.exp(logits), axis)
 Args:
 logits: A non-empty `Tensor`. Must be one of the following types: `half`,
  `float32`, `float64`.
 axis: The dimension softmax would be performed on. The default is -1 which
  indicates the last dimension.
 name: A name for the operation (optional).
 dim: Deprecated alias for `axis`.
 Returns:
 A `Tensor`. Has the same type and shape as `logits`.
 Raises:
 InvalidArgumentError: if `logits` is empty or `axis` is beyond the last
  dimension of `logits`.
 """
 axis = deprecation.deprecated_argument_lookup("axis", axis, "dim", dim)
 if axis is None:
 axis = -1
 return _softmax(logits, gen_nn_ops.softmax, axis, name)

softmax函数的返回结果和输入的tensor有相同的shape,既然没有改变tensor的形状,那么softmax究竟对tensor做了什么?

答案就是softmax会以某一个轴的下标为索引,对这一轴上其他维度的值进行 激活 + 归一化处理

一般来说,这个索引轴都是表示类别的那个维度(tf.nn.softmax中默认为axis=-1,也就是最后一个维度)

举例:

def softmax(X, theta = 1.0, axis = None):
 """
 Compute the softmax of each element along an axis of X.
 Parameters
 ----------
 X: ND-Array. Probably should be floats.
 theta (optional): float parameter, used as a multiplier
  prior to exponentiation. Default = 1.0
 axis (optional): axis to compute values along. Default is the
  first non-singleton axis.
 Returns an array the same size as X. The result will sum to 1
 along the specified axis.
 """
 
 # make X at least 2d
 y = np.atleast_2d(X)
 
 # find axis
 if axis is None:
  axis = next(j[0] for j in enumerate(y.shape) if j[1] > 1)
 
 # multiply y against the theta parameter,
 y = y * float(theta)
 
 # subtract the max for numerical stability
 y = y - np.expand_dims(np.max(y, axis = axis), axis)
 
 # exponentiate y
 y = np.exp(y)
 
 # take the sum along the specified axis
 ax_sum = np.expand_dims(np.sum(y, axis = axis), axis)
 
 # finally: divide elementwise
 p = y / ax_sum
 
 # flatten if X was 1D
 if len(X.shape) == 1: p = p.flatten()
 
 return p
c = np.random.randn(2,3)
print(c)
# 假设第0维是类别,一共有里两种类别
cc = softmax(c,axis=0)
# 假设最后一维是类别,一共有3种类别
ccc = softmax(c,axis=-1)
print(cc)
print(ccc)

结果:

c:
[[-1.30022268 0.59127472 1.21384177]
 [ 0.1981082 -0.83686108 -1.54785864]]
cc:
[[0.1826746 0.80661068 0.94057075]
 [0.8173254 0.19338932 0.05942925]]
ccc:
[[0.0500392 0.33172426 0.61823654]
 [0.65371718 0.23222472 0.1140581 ]]

可以看到,对axis=0的轴做softmax时,输出结果在axis=0轴上和为1(eg: 0.1826746+0.8173254),同理在axis=1轴上做的话结果的axis=1轴和也为1(eg: 0.0500392+0.33172426+0.61823654)。

这些值是怎么得到的呢?

以cc为例(沿着axis=0做softmax):

关于tensorflow softmax函数用法解析

以ccc为例(沿着axis=1做softmax):

关于tensorflow softmax函数用法解析

知道了计算方法,现在我们再来讨论一下这些值的实际意义:

cc[0,0]实际上表示这样一种概率: P( label = 0 | value = [-1.30022268 0.1981082] = c[*,0] ) = 0.1826746

cc[1,0]实际上表示这样一种概率: P( label = 1 | value = [-1.30022268 0.1981082] = c[*,0] ) = 0.8173254

ccc[0,0]实际上表示这样一种概率: P( label = 0 | value = [-1.30022268 0.59127472 1.21384177] = c[0]) = 0.0500392

ccc[0,1]实际上表示这样一种概率: P( label = 1 | value = [-1.30022268 0.59127472 1.21384177] = c[0]) = 0.33172426

ccc[0,2]实际上表示这样一种概率: P( label = 2 | value = [-1.30022268 0.59127472 1.21384177] = c[0]) = 0.61823654

将他们扩展到更多维的情况:假设c是一个[batch_size , timesteps, categories]的三维tensor

output = tf.nn.softmax(c,axis=-1)

那么 output[1, 2, 3] 则表示 P(label =3 | value = c[1,2] )

以上这篇关于tensorflow softmax函数用法解析就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python实现的检测网站挂马程序
Nov 30 Python
简单的编程0基础下Python入门指引
Apr 01 Python
详解Python的Django框架中的模版继承
Jul 16 Python
Python字符串切片操作知识详解
Mar 28 Python
浅谈python字典多键值及重复键值的使用
Nov 04 Python
Python实现扩展内置类型的方法分析
Oct 16 Python
如何用Python实现简单的Markdown转换器
Jul 16 Python
pycharm中使用anaconda部署python环境的方法步骤
Dec 19 Python
Python使用贪婪算法解决问题
Oct 22 Python
Python3之乱码\xe6\x97\xa0\xe6\xb3\x95处理方式
May 11 Python
django 解决自定义序列化返回处理数据为null的问题
May 20 Python
python 下划线的多种应用场景总结
May 12 Python
基于tensorflow for循环 while循环案例
Jun 30 #Python
解析Tensorflow之MNIST的使用
Jun 30 #Python
Tensorflow tensor 数学运算和逻辑运算方式
Jun 30 #Python
Python requests模块安装及使用教程图解
Jun 30 #Python
在Tensorflow中实现leakyRelu操作详解(高效)
Jun 30 #Python
TensorFlow-gpu和opencv安装详细教程
Jun 30 #Python
tensorflow 2.1.0 安装与实战教程(CASIA FACE v5)
Jun 30 #Python
You might like
Linux下安装PHP MSSQL扩展教程
2014/10/24 PHP
php实现生成PDF文件的方法示例【基于FPDF类库】
2018/07/21 PHP
CI框架实现创建自定义类库的方法
2018/12/25 PHP
ext 列表页面关于多行查询的办法
2010/03/25 Javascript
jquery.jstree 增加节点的双击事件代码
2010/07/27 Javascript
js使用函数绑定技术改变事件处理程序的作用域
2011/12/26 Javascript
js对象继承之原型链继承实例
2015/01/10 Javascript
jQuery标签编辑插件Tagit使用指南
2015/04/21 Javascript
js漂浮广告实现代码
2015/08/15 Javascript
js精美的幻灯片画集特效代码分享
2015/08/29 Javascript
jQuery unbind 删除绑定事件详解
2016/05/24 Javascript
使用yeoman构建angular应用的方法
2017/08/14 Javascript
使用D3.js+Vue实现一个简单的柱形图
2018/08/05 Javascript
解决vuecli3.0热更新失效的问题
2018/09/19 Javascript
JavaScript设计模式之策略模式实现原理详解
2020/05/29 Javascript
python 字符串格式化代码
2013/03/17 Python
wxpython学习笔记(推荐查看)
2014/06/09 Python
Python数据类型详解(一)字符串
2016/05/08 Python
python 3.6 tkinter+urllib+json实现火车车次信息查询功能
2017/12/20 Python
Scrapy基于selenium结合爬取淘宝的实例讲解
2018/06/13 Python
用python标准库difflib比较两份文件的异同详解
2018/11/16 Python
对PyQt5的输入对话框使用(QInputDialog)详解
2019/06/25 Python
matplotlib.pyplot.matshow 矩阵可视化实例
2020/06/16 Python
常用UNIX 命令(Linux的常用命令)
2015/12/26 面试题
介绍一下XMLHttpRequest对象的常用方法和属性
2013/05/24 面试题
外贸业务员求职自荐信分享
2013/09/21 职场文书
英文版区域经理求职信
2013/10/23 职场文书
服务中心夜班服务员岗位职责
2013/11/27 职场文书
医院护士的求职信范文
2013/12/26 职场文书
汽车机修工岗位职责
2014/03/06 职场文书
公司外出活动方案
2014/08/14 职场文书
教师听课评语大全
2014/12/31 职场文书
项目验收申请报告
2015/05/15 职场文书
九不准学习心得体会
2016/01/23 职场文书
java如何实现socket连接方法封装
2021/09/25 Java/Android
css中:last-child不生效的解决方法
2022/08/05 HTML / CSS