解决keras GAN训练是loss不发生变化,accuracy一直为0.5的问题


Posted in Python onJuly 02, 2020

1、Binary Cross Entropy

常用于二分类问题,当然也可以用于多分类问题,通常需要在网络的最后一层添加sigmoid进行配合使用,其期望输出值(target)需要进行one hot编码,另外BCELoss还可以用于多分类问题Multi-label classification.

定义:

For brevity, let x = output, z = target. The binary cross entropy loss is
loss(x, z) = - sum_i (x[i] * log(z[i]) + (1 - x[i]) * log(1 - z[i]))

对应的代码为:

def binary_crossentropy(t,o):
return -(t*tf.log(o+eps) + (1.0-t)*tf.log(1.0-o+eps))

2、Categorical cross-entropy

解决keras GAN训练是loss不发生变化,accuracy一直为0.5的问题

p are the predictions, t are the targets, i denotes the data point and j denotes the class.

适用于多分类问题,并使用softmax作为输出层的激活函数的情况。

补充知识:训练GAN的一些小贴士

下面是我认识到自己犯过的一些错误,以及我从中学到的一些东西。所以,如果你是GANs的新手,并没有看到在训练方面取得很大的成功,也许看看以下几个方面会有所帮助:

1、大卷积核和更多的滤波器

更大的卷积核覆盖了前一层图像中的更多像素,因此可以查看更多信息。5x5的核与CIFAR-10配合良好,在判别器中使用3x3核使判别器损耗迅速趋近于0。对于生成器,你希望在顶层的卷积层有更大的核,以保持某种平滑。在较低的层,我没有看到改变内核大小的任何主要影响。

滤波器的数量可以大量增加参数的数量,但通常需要更多的滤波器。我在几乎所有的卷积层中都使用了128个滤波器。使用较少的滤波器,特别是在生成器中,使得最终生成的图像过于模糊。因此,看起来更多的滤波器可以帮助捕获额外的信息,最终为生成的图像增加清晰度。

2、标签翻转(Generated=True, Real=False)

虽然一开始看起来很傻,但对我有用的一个主要技巧是更改标签分配。

如果你使用的是Real Images = 1,而生成的图像= 0,则使用另一种方法会有所帮助。正如我们将在后面看到的,这有助于在早期迭代中使用梯度流,并帮助使梯度流动。

3、使用有噪声的标签和软标签

这在训练判别器时是非常重要的。硬标签(1或0)几乎扼杀了早期的所有学习,导致识别器非常快地接近0损失。最后,我使用0到0.1之间的随机数表示0标签(真实图像),使用0.9到1.0之间的随机数表示1标签(生成的图像)。在训练生成器时不需要这样做。

此外,增加一些噪音的训练标签也是有帮助的。对于输入识别器的5%的图像,标签被随机翻转。比如真实的被标记为生成的,生成的被标记为真实的。

4、使用批归一化是有用的,但是需要有其他的东西也是合适的

批归一化无疑有助于最终的结果。添加批归一化后,生成的图像明显更清晰。但是,如果你错误地设置了卷积核或滤波器,或者识别器的损失很快达到0,添加批归一化可能并不能真正帮助恢复。

5、每次一个类别

为了更容易地训练GANs,确保输入数据具有相似的特征是很有用的。例如,与其在CIFAR-10的所有10个类中都训练GAN,不如选择一个类(例如,汽车或青蛙)并训练GANs从该类生成图像。DC-GAN的其他变体在学习生成多个类的图像方面做得更好。例如,以类标签为输入,生成基于类标签的图像。但是,如果你从一个普通的DC-GAN开始,最好保持事情简单。

6、查看梯度

如果可能的话,试着监控梯度以及网络中的损失。这些可以帮助你更好地了解训练的进展,甚至可以帮助你在工作不顺利的情况下进行调试。

理想情况下,生成器应该在训练的早期获得较大的梯度,因为它需要学习如何生成真实的数据。另一方面,判别器并不总是在早期获得较大的梯度,因为它可以很容易地区分真假图像。一旦生成器得到足够的训练,判别器就很难分辨真假图像。它会不断出错,并得到大的梯度。

以上这篇解决keras GAN训练是loss不发生变化,accuracy一直为0.5的问题就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
pycharm 使用心得(五)断点调试
Jun 06 Python
Python中使用platform模块获取系统信息的用法教程
Jul 08 Python
关于python pyqt5安装失败问题的解决方法
Aug 08 Python
Python日期时间模块datetime详解与Python 日期时间的比较,计算实例代码
Sep 14 Python
详解Python安装tesserocr遇到的各种问题及解决办法
Mar 07 Python
python使用sessions模拟登录淘宝的方式
Aug 16 Python
Pandas数据离散化原理及实例解析
Nov 16 Python
使用Python实现正态分布、正态分布采样
Nov 20 Python
pycharm实现在虚拟环境中引入别人的项目
Mar 09 Python
浅谈Python线程的同步互斥与死锁
Mar 22 Python
浅谈Python中threading join和setDaemon用法及区别说明
May 02 Python
python3+PyQt5+Qt Designer实现界面可视化
Jun 10 Python
解决keras,val_categorical_accuracy:,0.0000e+00问题
Jul 02 #Python
如何基于Python爬取隐秘的角落评论
Jul 02 #Python
keras中epoch,batch,loss,val_loss用法说明
Jul 02 #Python
Python使用tkinter实现摇骰子小游戏功能的代码
Jul 02 #Python
浅谈keras使用预训练模型vgg16分类,损失和准确度不变
Jul 02 #Python
python脚本和网页有何区别
Jul 02 #Python
keras:model.compile损失函数的用法
Jul 01 #Python
You might like
BBS(php & mysql)完整版(一)
2006/10/09 PHP
php强制用户转向www域名的方法
2015/06/19 PHP
非集成环境的php运行环境(Apache配置、Mysql)搭建安装图文教程
2016/04/12 PHP
ThinkPHP中limit()使用方法详解
2016/04/19 PHP
thinkphp Apache配置重启Apache1 restart 出错解决办法
2017/02/15 PHP
PHP 7.0新增加的特性介绍
2017/06/08 PHP
防止xss和sql注入:JS特殊字符过滤正则
2013/04/18 Javascript
解析prototype,JQuery中跳出each循环的方法
2013/12/12 Javascript
js对象转json数组的简单实现案例
2014/02/28 Javascript
Bootstrap实现的标签页内容切换显示效果示例
2017/05/25 Javascript
简单实现js上传文件功能
2017/08/21 Javascript
微信小程序提交form操作示例
2018/12/30 Javascript
Vue自定义指令写法与个人理解
2019/02/09 Javascript
vue2 中二级路由高亮问题及配置方法
2019/06/10 Javascript
借助云开发实现小程序短信验证码的发送
2020/01/06 Javascript
优化Vue中date format的性能详解
2020/01/13 Javascript
微信小程序仿抖音短视频切换效果的实例代码
2020/06/24 Javascript
Python实现将目录中TXT合并成一个大TXT文件的方法
2015/07/15 Python
利用python实现命令行有道词典的方法示例
2017/01/31 Python
python 删除列表里所有空格项的方法总结
2018/04/18 Python
Python3基于sax解析xml操作示例
2018/05/22 Python
Python读取txt某几列绘图的方法
2018/10/14 Python
记一次python 内存泄漏问题及解决过程
2018/11/29 Python
Python自定义一个类实现字典dict功能的方法
2019/01/19 Python
python变量命名的7条建议
2019/07/04 Python
详解用Pytest+Allure生成漂亮的HTML图形化测试报告
2020/03/31 Python
Python如何批量生成和调用变量
2020/11/21 Python
深入剖析webstorage[html5的本地数据处理]
2016/07/11 HTML / CSS
单位介绍信范文
2014/01/18 职场文书
本科生求职信
2014/06/17 职场文书
车辆年审委托书范本
2014/09/18 职场文书
学生不讲诚信检讨书
2014/09/29 职场文书
学校群众路线专项整治方案
2014/10/31 职场文书
大学生学习十八届五中全会精神心得体会
2016/01/05 职场文书
六年级语文教学反思
2016/03/03 职场文书
Redis高级数据类型Hyperloglog、Bitmap的使用
2021/05/24 Redis