Keras 中Leaky ReLU等高级激活函数的用法


Posted in Python onJuly 05, 2020

在用Keras来实现CNN等一系列网络时,我们经常用ReLU作为激活函数,一般写法如下:

from keras import layers
from keras import models
 
model = models.Sequential()
model.add(layers.Conv2D(32, (3, 3), activation='relu', input_shape=(28, 28, 1))) 
model.add(layers.MaxPooling2D((2, 2)))
model.add(layers.Conv2D(64, (3, 3), activation='relu')) 
model.add(layers.MaxPooling2D((2, 2)))
model.add(layers.Conv2D(64, (3, 3), activation='relu'))

上面这段代码实现了一个基本的卷积神经网络,用ReLU作为激活函数,关于ReLU具体内容不做详细介绍。还有一些常用的主流激活函数:

softmax: 在多分类中常用的激活函数,是基于逻辑回归的。

Softplus:softplus(x)=log(1+e^x),近似生物神经激活函数,最近出现的。

Relu:近似生物神经激活函数,最近出现的。

tanh:双曲正切激活函数,也是很常用的。

sigmoid:S型曲线激活函数,最常用的。

hard_sigmoid:基于S型激活函数。

linear:线性激活函数,最简单的。

主流的激活函数可以如上述例子一样通过名称直接使用,但是还有一些复杂的激活函数如:Leaky ReLU、PReLU是不可以这样直接使用的,必须使用add方法将高级激活函数作为层(layer)来使用,举例如下:

from keras import layers
from keras import models
from keras.layers import LeakyReLU
 
model = models.Sequential()
model.add(layers.Conv2D(32, (3, 3), input_shape=(28, 28, 1)))
model.add(LeakyReLU(alpha=0.05))
model.add(layers.MaxPooling2D((2, 2))) 
 
model.add(layers.Conv2D(64, (3, 3))) 
model.add(LeakyReLU(alpha=0.05))
model.add(layers.MaxPooling2D((2, 2)))
 
model.add(layers.Conv2D(64, (3, 3))
model.add(LeakyReLU(alpha=0.05))

这里我们在卷积层中去掉激活函数的参数,并在卷积层后加入高级激活层,下面来测试:

>>model.summary()

Keras 中Leaky ReLU等高级激活函数的用法

这里从整个网络结构的结果可以看出,卷积层后确实加入了一层新的激活层,使用的是LeakyReLU函数。

补充知识:Keras 调用leaky_relu

Keras 中有leaky_relu的实现。leaky_relu被整合进了relu函数。

参考官方文档:

https://tensorflow.google.cn/api_docs/python/tf/keras/backend/relu?hl=en

Arguments
x A tensor or variable.
alpha A scalar, slope of negative section (default=0.).
max_value float. Saturation threshold.
threshold float. Threshold value for thresholded activation.

alpha(超参数)值控制负数部分线性函数的梯度。当alpha = 0 ,是原始的relu函数。当alpha >0,即为leaky_relu。

查看源码,在Keras.backbend 中,也是调用tensorflow.python.ops库nn中的leaky_relu函数实现的:

def relu(x, alpha=0., max_value=None, threshold=0):
 """Rectified linear unit.
 With default values, it returns element-wise `max(x, 0)`.
 Otherwise, it follows:
 `f(x) = max_value` for `x >= max_value`,
 `f(x) = x` for `threshold <= x < max_value`,
 `f(x) = alpha * (x - threshold)` otherwise.
 Arguments:
   x: A tensor or variable.
   alpha: A scalar, slope of negative section (default=`0.`).
   max_value: float. Saturation threshold.
   threshold: float. Threshold value for thresholded activation.
 Returns:
   A tensor.
 """

 if alpha != 0.:
  if max_value is None and threshold == 0:
   return nn.leaky_relu(x, alpha=alpha)  ##在这里调用了leaky_relu

  if threshold != 0:
   negative_part = nn.relu(-x + threshold)
  else:
   negative_part = nn.relu(-x)

 clip_max = max_value is not None

 if threshold != 0:
  # computes x for x > threshold else 0
  x = x * math_ops.cast(math_ops.greater(x, threshold), floatx())
 elif max_value == 6:
  # if no threshold, then can use nn.relu6 native TF op for performance
  x = nn.relu6(x)
  clip_max = False
 else:
  x = nn.relu(x)

 if clip_max:
  max_value = _constant_to_tensor(max_value, x.dtype.base_dtype)
  zero = _constant_to_tensor(0, x.dtype.base_dtype)
  x = clip_ops.clip_by_value(x, zero, max_value)

 if alpha != 0.:
  alpha = _to_tensor(alpha, x.dtype.base_dtype)
  x -= alpha * negative_part
 return x

以上这篇Keras 中Leaky ReLU等高级激活函数的用法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
详解Python的单元测试
Apr 28 Python
Python可变参数用法实例分析
Apr 02 Python
Python反射用法实例简析
Dec 22 Python
Python cookbook(数据结构与算法)让字典保持有序的方法
Feb 18 Python
python3中获取文件当前绝对路径的两种方法
Apr 26 Python
python计算两个地址之间的距离方法
Jun 09 Python
python issubclass 和 isinstance函数
Jul 25 Python
基于django ManyToMany 使用的注意事项详解
Aug 09 Python
Flask框架学习笔记之消息提示与异常处理操作详解
Aug 15 Python
Python函数基本使用原理详解
Mar 19 Python
python中线程和进程有何区别
Jun 17 Python
python元组打包和解包过程详解
Aug 02 Python
Django --Xadmin 判断登录者身份实例
Jul 03 #Python
详解Python多线程下的list
Jul 03 #Python
Python 字符串池化的前提
Jul 03 #Python
Pycharm打开已有项目配置python环境的方法
Jul 03 #Python
使用Dajngo 通过代码添加xadmin用户和权限(组)
Jul 03 #Python
windows支持哪个版本的python
Jul 03 #Python
Django Form设置文本框为readonly操作
Jul 03 #Python
You might like
一个简单实现多条件查询的例子
2006/10/09 PHP
php中的路径问题与set_include_path使用介绍
2014/02/11 PHP
Laravel框架路由配置总结、设置技巧大全
2014/09/03 PHP
php判断linux下程序问题实例
2015/07/09 PHP
PHP用mb_string函数库处理与windows相关中文字符及Win环境下开启PHP Mb_String方法
2015/11/11 PHP
Yii实现Command任务处理的方法详解
2016/07/14 PHP
PHP数据对象PDO操作技巧小结
2016/09/27 PHP
PHP实现UTF8二进制及明文字符串的转化功能示例
2017/11/20 PHP
Laravel框架使用Redis的方法详解
2018/05/30 PHP
php实例化一个类的具体方法
2019/09/19 PHP
Javascript学习笔记5 类和对象
2010/01/11 Javascript
JS逆序遍历实现代码
2014/12/02 Javascript
jQuery使用CSS()方法给指定元素同时设置多个样式
2015/03/26 Javascript
jQuery Dialog 打开时自动聚焦的解决方法(两种方法)
2016/11/24 Javascript
Angular在一个页面中使用两个ng-app的方法(二)
2017/02/20 Javascript
Angular.js组件之input mask对input输入进行格式化详解
2017/07/10 Javascript
基于js粘贴事件paste简单解析以及遇到的坑
2017/09/07 Javascript
Vue-resource拦截器判断token失效跳转的实例
2017/10/27 Javascript
node.js 模块和其下载资源的镜像设置的方法
2018/09/06 Javascript
vue中axios请求的封装实例代码
2019/03/23 Javascript
vue和小程序项目中使用iconfont的方法
2020/05/19 Javascript
基于JQuery和DWR实现异步数据传递
2020/10/16 jQuery
[01:22:29]真视界:2019年国际邀请赛总决赛
2020/01/29 DOTA
Python模仿POST提交HTTP数据及使用Cookie值的方法
2014/11/10 Python
Django中使用locals()函数的技巧
2015/07/16 Python
常见的python正则用法实例讲解
2016/06/21 Python
Python实现繁体中文与简体中文相互转换的方法示例
2018/12/18 Python
python文字和unicode/ascll相互转换函数及简单加密解密实现代码
2019/08/12 Python
python 递归调用返回None的问题及解决方法
2020/03/16 Python
div或img图片高度随宽度自适应的方法
2020/02/06 HTML / CSS
Levi’s美国官网:美国著名的牛仔裤品牌
2016/08/19 全球购物
What is EJB
2016/07/22 面试题
MYSQL相比于其他数据库有哪些特点
2013/07/19 面试题
教师实习自我鉴定
2013/12/18 职场文书
户外用品商店创业计划书
2014/01/29 职场文书
人力资源部经理助理岗位职责
2014/03/04 职场文书