python 深度学习中的4种激活函数


Posted in Python onSeptember 18, 2020

这篇文章用来整理一下入门深度学习过程中接触到的四种激活函数,下面会从公式、代码以及图像三个方面介绍这几种激活函数,首先来明确一下是哪四种:

  • Sigmoid函数
  • Tahn函数
  • ReLu函数
  • SoftMax函数

激活函数的作用

下面图像A是一个线性可分问题,也就是说对于两类点(蓝点和绿点),你通过一条直线就可以实现完全分类。

python 深度学习中的4种激活函数

当然图像A是最理想、也是最简单的一种二分类问题,但是现实中往往存在一些非常复杂的线性不可分问题,比如图像B,你是找不到任何一条直线可以将图像B中蓝点和绿点完全分开的,你必须圈出一个封闭曲线。

而激活函数就是帮助"绘制"这个封闭曲线的非线性函数,有了激活函数的帮助,很多算法的处理能力会得到加强,也可以处理线性不可分问题。

Sigmoid函数

Sigmoid函数曾在介绍逻辑回归时提起过,它的数学表达式为:

python 深度学习中的4种激活函数

其中 e 为纳皮尔常数,其值为2.7182... 它的图像如下:

python 深度学习中的4种激活函数

可以观察出图像的一些特点:

  • 曲线的值域为(0,1)
  • 当x = 0时,Sigmoid函数值为0.5
  • 随着 x 不断增大,Sigmoid函数值无限趋近于1
  • 随着 x 不断减小,Sigmoid函数值无限趋近于0

对于梯度下降法而言,信息的更新很大程度上都取决于梯度,而Sigmoid函数一个很明显的缺点就是当函数值特别靠近0或1这两端时,因为它的曲线已经近乎平缓,所以此时的梯度几乎为0,这样非常不利于权重的更新,从而就会导致模型不收敛。

Sigmoid函数的代码如下:

import numpy as np
def tanh(x):
 return (exp(x)-exp(-x))/(exp(x)+exp(-x))

Tanh函数

Tanh函数是双曲正切函数,它的的数学表达式为:

python 深度学习中的4种激活函数

Tanh函数和Sigmoid函数非常相近,这点从图像上可以很好的体现:

python 深度学习中的4种激活函数

这两个函数相同的是,当输入的 x 值很大或者很小时,对应函数输出的 y 值近乎相等,同样的缺点也是梯度特别小,非常不利于权重的更新;不同的是Tanh函数的值域为(-1,1),并且当 x = 0 时,输出的函数值为0。

Tanh函数的代码如下:

import numpy as np
def tanh(x):
 return (exp(x)-exp(-x))/(exp(x)+exp(-x))

ReLu函数

ReLu是线性整流函数,又称为修正性线性单元,它的函数的数学表达式为

python 深度学习中的4种激活函数

Tanh是一个分段函数,它的图像如下:

python 深度学习中的4种激活函数

图像很容易理解,若输入的 x 值小于0,则输出为也为0;若输入的 x 值大于0,则直接输出 x 值,需要注意的是ReLu函数在x = 0 处不连续(不可导),但同样也可以作为激活函数。

与Sigmoid函数和Tanh函数相比,ReLu函数一个很明显的优点就是在应用梯度下降法是收敛较快,当输入值为整数时,不会出现梯度饱和的问题,因为大于0的部分是一个线性关系,这个优点让ReLu成为目前应用较广的激活函数。

ReLu函数的代码如下:

import numpy as np
def relu(x):
 return np.maximum(0,x)

SoftMax函数

分类问题可以分为二分类问题和多分类问题,Sigmoid函数比较适合二分类问题,而SoftMax函数更加适合多分类问题。
SoftMax函数的数学表达式为:

python 深度学习中的4种激活函数

其中Vi表示分类器的输出,i表示类别索引,总的类别个数为C,Si表示当前元素的指数与所有元素指数和的比值。概括来说,SoftMax函数将多分类的输出值按比例转化为相对概率,使输出更容易理解和比较。

为了防止SoftMax函数计算时出现上溢出或者下溢出的问题,通常会提前对 V 做一些数值处理,即每个 V 减去 V 中的最大值,假设D=max(V),SoftMax函数数学表达式更改为:

python 深度学习中的4种激活函数

因为SoftMax函数计算的是概率,所以无法用图像进行展示,SoftMax函数的代码如下:

import numpy as np
def softmax(x):
 D = np.max(x)
 exp_x = np.exp(x-D)
 return exp_x / np.sum(exp_x)

以上就是python 深度学习中的4种激活函数的详细内容,更多关于python 激活函数的资料请关注三水点靠木其它相关文章!

Python 相关文章推荐
在Python中使用next()方法操作文件的教程
May 24 Python
Python科学计算之NumPy入门教程
Jan 15 Python
Python数据可视化教程之Matplotlib实现各种图表实例
Jan 13 Python
PyCharm 设置SciView工具窗口的方法
Jan 15 Python
Python Flask框架扩展操作示例
May 03 Python
numpy.linspace函数具体使用详解
May 27 Python
对PyQt5基本窗口控件 QMainWindow的使用详解
Jun 19 Python
python实现微信自动回复机器人功能
Jul 11 Python
Python爬虫实现自动登录、签到功能的代码
Aug 20 Python
Python的3种运行方式:命令行窗口、Python解释器、IDLE的实现
Oct 10 Python
Alpine安装Python3依赖出现的问题及解决方法
Dec 25 Python
python 实现图片裁剪小工具
Feb 02 Python
python闭包与引用以及需要注意的陷阱
Sep 18 #Python
python 代码运行时间获取方式详解
Sep 18 #Python
python判断字符串以什么结尾的实例方法
Sep 18 #Python
python绘制趋势图的示例
Sep 17 #Python
Python绘制组合图的示例
Sep 18 #Python
记一次Django响应超慢的解决过程
Sep 17 #Python
Visual Studio Code搭建django项目的方法步骤
Sep 17 #Python
You might like
php实现通用的从数据库表读取数据到数组的函数实例
2015/03/21 PHP
说说JSON和JSONP 也许你会豁然开朗
2012/09/02 Javascript
JavaScript实现复制功能各浏览器支持情况实测
2013/07/18 Javascript
JavaScript实现获取dom中class的方法
2015/02/09 Javascript
jQuery+PHP实现动态数字展示特效
2015/03/14 Javascript
有关json_decode乱码及NULL的问题
2015/10/13 Javascript
javascript bom是什么及bom和dom的区别
2015/11/26 Javascript
js实现人民币大写金额形式转换
2016/04/27 Javascript
微信小程序  action-sheet详解及实例代码
2016/11/09 Javascript
jquery uploadify如何取消已上传成功文件
2017/02/08 Javascript
搭建element-ui的Vue前端工程操作实例
2018/02/23 Javascript
vue自定义指令实现方法详解
2019/02/11 Javascript
微信小程序生成分享海报方法(附带二维码生成)
2019/03/29 Javascript
解决vue 单文件组件中样式加载问题
2019/04/24 Javascript
JS原生瀑布流效果实现
2019/04/26 Javascript
vue-cli 3 全局过滤器的实例代码详解
2019/06/03 Javascript
javascript/jquery实现点击触发事件的方法分析
2019/11/11 jQuery
jQuery实现鼠标拖拽登录框移动效果
2020/09/13 jQuery
[03:48]2014DOTA2 TI专访71DK夺冠不靠小组赛高排名
2014/07/11 DOTA
总结网络IO模型与select模型的Python实例讲解
2016/06/27 Python
关于Django外键赋值问题详解
2017/08/13 Python
python+django+sql学生信息管理后台开发
2018/01/11 Python
Python中跳台阶、变态跳台阶与矩形覆盖问题的解决方法
2018/05/19 Python
python使用Matplotlib绘制分段函数
2018/09/25 Python
python 画三维图像 曲面图和散点图的示例
2018/12/29 Python
什么是Python包的循环导入
2020/09/08 Python
Django-silk性能测试工具安装及使用解析
2020/11/28 Python
CSS3实现千变万化的文字阴影text-shadow效果设计
2016/04/26 HTML / CSS
Myprotein加拿大官网:欧洲第一的运动营养品牌
2018/01/06 全球购物
sleep()方法和wait()方法的区别是什么
2012/11/17 面试题
董事长职责范文
2013/11/08 职场文书
电脑饰品店的创业计划书
2014/01/21 职场文书
2014年入党积极分子党课学习心得体会模板
2014/04/03 职场文书
青春寄语大全
2014/04/09 职场文书
保留意见审计报告
2015/06/05 职场文书
Python学习之os包使用教程详解
2022/03/21 Python