浅谈Keras中shuffle和validation_split的顺序


Posted in Python onJune 19, 2020

模型的fit函数有两个参数,shuffle用于将数据打乱,validation_split用于在没有提供验证集的时候,按一定比例从训练集中取出一部分作为验证集

这里有个陷阱是,程序是先执行validation_split,再执行shuffle的,所以会出现这种情况:

假如你的训练集是有序的,比方说正样本在前负样本在后,又设置了validation_split,那么你的验证集中很可能将全部是负样本

同样的,这个东西不会有任何错误报出来,因为Keras不可能知道你的数据有没有经过shuffle,保险起见如果你的数据是没shuffle过的,最好手动shuffle一下

补充知识:Keras使用陷阱

1 TF卷积核与TH卷积核

Keras提供了两套后端,Theano和Tensorflow。如果你从无到有搭建自己的一套网络,则大可放心。但如果你想使用一个已有网络,或把一个用th/tf 训练的网络以另一种后端应用,在载入的时候你就应该特别小心了。

卷积核与所使用的后端不匹配,不会报任何错误,因为它们的shape是完全一致的,没有方法能够检测出这种错误。

在使用预训练模型时,一个建议是首先找一些测试样本,看看模型的表现是否与预计的一致。

如需对卷积核进行转换,可以使用utils.convert_all_kernels_in_model对模型的所有卷积核进行转换

2 向BN层中载入权重

如果你不知道从哪里淘来一个预训练好的BN层,想把它的权重载入到Keras中,要小心参数的载入顺序。

一个典型的例子是,将caffe的BN层参数载入Keras中,caffe的BN由两部分构成,bn层的参数是mean,std,scale层的参数是gamma,beta。

按照BN的文章顺序,似乎载入Keras BN层的参数应该是[mean, std, gamma, beta];

然而不是的,Keras的BN层参数顺序应该是[gamma, beta, mean, std],这是因为gamma和beta是可训练的参数,而mean和std不是。Keras的可训练参数在前,不可训练参数在后

错误的权重顺序不会引起任何报错,因为它们的shape完全相同

3 shuffle和validation_split的顺序

模型的fit函数有两个参数,shuffle用于将数据打乱,validation_split用于在没有提供验证集的时候,按一定比例从训练集中取出一部分作为验证集.

这里有个陷阱是,程序是先执行validation_split,再执行shuffle的,所以会出现这种情况:

假如你的训练集是有序的,比方说正样本在前负样本在后,又设置了validation_split,那么你的验证集中很可能将全部是负样本。

同样的,这个东西不会有任何错误报出来,因为Keras不可能知道你的数据有没有经过shuffle,保险起见如果你的数据是没shuffle过的,最好手动shuffle一下。

4 Merge层的层对象与函数方法

Keras定义了一套用于融合张量的方法,位于keras.layers.Merge,里面有两套工具,以大写字母开头的是Keras Layer类,使用这种工具是需要实例化一个Layer对象,然后再使用。以小写字母开头的是张量函数方法,本质上是对Merge Layer对象的一个包装,但使用更加方便一些。注意辨析。

以上这篇浅谈Keras中shuffle和validation_split的顺序就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python完全新手教程
Feb 08 Python
Python中使用中文的方法
Feb 19 Python
Python解决鸡兔同笼问题的方法
Dec 20 Python
Python使用matplotlib实现绘制自定义图形功能示例
Jan 18 Python
Python3使用turtle绘制超立方体图形示例
Jun 19 Python
tensorflow入门:tfrecord 和tf.data.TFRecordDataset的使用
Jan 20 Python
pycharm运行程序时看不到任何结果显示的解决
Feb 21 Python
浅析PyCharm 的初始设置(知道)
Oct 12 Python
python爬虫中url管理器去重操作实例
Nov 30 Python
Python 获取异常(Exception)信息的几种方法
Dec 29 Python
plt.figure()参数使用详解及运行演示
Jan 08 Python
python中%格式表达式实例用法
Jun 18 Python
Python爬虫headers处理及网络超时问题解决方案
Jun 19 #Python
sklearn和keras的数据切分与交叉验证的实例详解
Jun 19 #Python
Python虚拟环境的创建和包下载过程分析
Jun 19 #Python
通过实例解析python创建进程常用方法
Jun 19 #Python
keras model.fit 解决validation_spilt=num 的问题
Jun 19 #Python
为什么是 Python -m
Jun 19 #Python
Python 私有属性和私有方法应用场景分析
Jun 19 #Python
You might like
PHP开发大型项目的一点经验
2006/10/09 PHP
PHP连接SQLServer2005的实现方法(附ntwdblib.dll下载)
2012/07/02 PHP
Laravel最佳分割路由文件(routes.php)的方式
2016/08/04 PHP
php运行报错Call to undefined function curl_init()的最新解决方法
2016/11/20 PHP
javascript 手动给表增加数据的小例子
2013/07/10 Javascript
Javascript连接Access数据库完整实例
2015/08/03 Javascript
JS+CSS实现的竖向简洁折叠菜单效果代码
2015/10/22 Javascript
js使用cookie记录用户名的方法
2015/11/26 Javascript
JS动态创建元素的两种方法
2016/04/20 Javascript
JavaScript中Array的实用操作技巧分享
2016/09/11 Javascript
基于BootStrap与jQuery.validate实现表单提交校验功能
2016/12/22 Javascript
vue货币过滤器的实现方法
2017/04/01 Javascript
bootstrap响应式表格实例详解
2017/05/15 Javascript
angularjs实现猜大小功能
2017/10/23 Javascript
jquery.onoff实现简单的开关按钮功能(推荐)
2018/05/24 jQuery
详解vue更改头像功能实现
2019/04/28 Javascript
基于vue-cli3+typescript的tsx开发模板搭建过程分享
2020/02/28 Javascript
js实现简单扫雷
2020/11/27 Javascript
uin-app+mockjs实现本地数据模拟
2020/08/26 Javascript
微信小程序弹窗禁止页面滚动的实现代码
2020/12/30 Javascript
[39:46]完美世界DOTA2联赛PWL S2 LBZS vs Rebirth 第二场 11.25
2020/11/25 DOTA
朴素贝叶斯算法的python实现方法
2014/11/18 Python
Python实现比较两个列表(list)范围
2015/06/12 Python
python中函数默认值使用注意点详解
2016/06/01 Python
Python通过matplotlib画双层饼图及环形图简单示例
2017/12/15 Python
python爬虫爬取快手视频多线程下载功能
2018/02/28 Python
python批量实现Word文件转换为PDF文件
2018/03/15 Python
python删除不需要的python文件方法
2018/04/24 Python
PyQt5使用QTimer实现电子时钟
2019/07/29 Python
python 直接赋值和copy的区别详解
2019/08/07 Python
python实现PCA降维的示例详解
2020/02/24 Python
财政专业大学生职业生涯规划书
2014/09/17 职场文书
学校教学工作总结2015
2015/05/19 职场文书
使用Python+OpenCV进行卡类型及16位卡号数字的OCR功能
2021/08/30 Python
Python编程源码报错解决方法总结经验分享
2021/10/05 Python
Windows11插耳机没反应怎么办? win11耳机没声音的多种解决办法
2021/11/21 数码科技