编程 Python

keras 回调函数Callbacks 断点ModelCheckpoint教程

Posted in Python onJune 18, 2020

整理自keras：https://keras-cn.readthedocs.io/en/latest/other/callbacks/

回调函数Callbacks

回调函数是一个函数的合集，会在训练的阶段中所使用。你可以使用回调函数来查看训练模型的内在状态和统计。你可以传递一个列表的回调函数（作为 callbacks 关键字参数）到 Sequential 或 Model 类型的 .fit() 方法。在训练时，相应的回调函数的方法就会被在各自的阶段被调用。

Callback

keras.callbacks.Callback()

这是回调函数的抽象类，定义新的回调函数必须继承自该类

类属性

params：字典，训练参数集（如信息显示方法verbosity，batch大小，epoch数）

model：keras.models.Model对象，为正在训练的模型的引用

回调函数以字典logs为参数，该字典包含了一系列与当前batch或epoch相关的信息。

目前，模型的.fit()中有下列参数会被记录到logs中：

在每个epoch的结尾处（on_epoch_end），logs将包含训练的正确率和误差，acc和loss，如果指定了验证集，还会包含验证集正确率和误差val_acc)和val_loss，val_acc还额外需要在.compile中启用metrics=['accuracy']。

在每个batch的开始处（on_batch_begin）：logs包含size，即当前batch的样本数

在每个batch的结尾处（on_batch_end）：logs包含loss，若启用accuracy则还包含acc

ModelCheckpoint

keras.callbacks.ModelCheckpoint(filepath, monitor='val_loss', verbose=0, save_best_only=False, save_weights_only=False, mode='auto', period=1)

该回调函数将在每个epoch后保存模型到filepath

filepath 可以包括命名格式选项，可以由 epoch 的值和 logs 的键（由 on_epoch_end 参数传递）来填充。

参数：

filepath: 字符串，保存模型的路径。

monitor: 被监测的数据。val_acc或这val_loss

verbose: 详细信息模式，0 或者 1 。0为不打印输出信息，1打印

save_best_only: 如果 save_best_only=True，将只保存在验证集上性能最好的模型

mode: {auto, min, max} 的其中之一。如果 save_best_only=True，那么是否覆盖保存文件的决定就取决于被监测数据的最大或者最小值。对于 val_acc，模式就会是 max，而对于 val_loss，模式就需要是 min，等等。在 auto 模式中，方向会自动从被监测的数据的名字中判断出来。

save_weights_only: 如果 True，那么只有模型的权重会被保存 (model.save_weights(filepath))，否则的话，整个模型会被保存 (model.save(filepath))。

period: 每个检查点之间的间隔（训练轮数）。

代码实现过程：

① 从keras.callbacks导入ModelCheckpoint类

from keras.callbacks import ModelCheckpoint

② 在训练阶段的model.compile之后加入下列代码实现每一次epoch（period=1）保存最好的参数

checkpoint = ModelCheckpoint(filepath,
monitor='val_loss', save_weights_only=True,verbose=1,save_best_only=True, period=1)

③ 在训练阶段的model.fit之前加载先前保存的参数

if os.path.exists(filepath):
 model.load_weights(filepath)
 # 若成功加载前面保存的参数，输出下列信息
 print("checkpoint_loaded")

④ 在model.fit添加callbacks=[checkpoint]实现回调

model.fit_generator(data_generator_wrap(lines[:num_train], batch_size, input_shape, anchors, num_classes),
 steps_per_epoch=max(1, num_train//batch_size),
 validation_data=data_generator_wrap(lines[num_train:], batch_size, input_shape, anchors, num_classes),
 validation_steps=max(1, num_val//batch_size),
 epochs=3,
 initial_epoch=0,
 callbacks=[checkpoint])

补充知识：keras之多输入多输出（多任务）模型

keras多输入多输出模型，以keras官网的demo为例，分析keras多输入多输出的适用。

主要输入(main_input): 新闻标题本身，即一系列词语。

辅助输入(aux_input): 接受额外的数据，例如新闻标题的发布时间等。

该模型将通过两个损失函数进行监督学习。

较早地在模型中使用主损失函数，是深度学习模型的一个良好正则方法。

完整过程图示如下：

keras 回调函数Callbacks 断点ModelCheckpoint教程

其中，红圈中的操作为将辅助数据与LSTM层的输出连接起来，输入到模型中。

代码实现：

import keras
from keras.layers import Input, Embedding, LSTM, Dense
from keras.models import Model
 
# 定义网络模型 
# 标题输入：接收一个含有 100 个整数的序列，每个整数在 1 到 10000 之间
# 注意我们可以通过传递一个 `name` 参数来命名任何层
main_input = Input(shape=(100,), dtype='int32', name='main_input')
 
# Embedding 层将输入序列编码为一个稠密向量的序列，每个向量维度为 512
x = Embedding(output_dim=512, input_dim=10000, input_length=100)(main_input)
 
# LSTM 层把向量序列转换成单个向量，它包含整个序列的上下文信息
lstm_out = LSTM(32)(x)
 
# 在这里我们添加辅助损失，使得即使在模型主损失很高的情况下，LSTM层和Embedding层都能被平稳地训练
auxiliary_output = Dense(1, activation='sigmoid', name='aux_output')(lstm_out)
 
# 此时，我们将辅助输入数据与LSTM层的输出连接起来,输入到模型中
auxiliary_input = Input(shape=(5,), name='aux_input')
x = keras.layers.concatenate([lstm_out, auxiliary_output])
 
# 再添加剩余的层
# 堆叠多个全连接网络层
x = Dense(64, activation='relu')(x)
x = Dense(64, activation='relu')(x)
x = Dense(64, activation='relu')(x)
 
# 最后添加主要的逻辑回归层
main_output = Dense(1, activation='sigmoid', name='main_output')(x)
 
# 定义这个具有两个输入和输出的模型
model = Model(inputs=[main_input, auxiliary_input], outputs=[main_output, auxiliary_output])
 
# 编译模型时候分配损失函数权重：编译模型的时候，给 辅助损失 分配一个0.2的权重
model.compile(optimizer='rmsprop', loss='binary_crossentropy', loss_weights=[1., 0.2])
 
# 训练模型：我们可以通过传递输入数组和目标数组的列表来训练模型
model.fit([headline_data, additional_data], [labels, labels], epochs=50, batch_size=32)
 
# 另外一种利用字典的编译、训练方式
# 由于输入和输出均被命名了（在定义时传递了一个 name 参数），我们也可以通过以下方式编译模型
model.compile(optimizer='rmsprop',
    loss={'main_output': 'binary_crossentropy', 'aux_output': 'binary_crossentropy'},
    loss_weights={'main_output': 1., 'aux_output': 0.2})
# 然后使用以下方式训练：
model.fit({'main_input': headline_data, 'aux_input': additional_data},
   {'main_output': labels, 'aux_output': labels},
   epochs=50, batch_size=32)

相关参考：https://keras.io/zh/getting-started/functional-api-guide/

以上这篇keras 回调函数Callbacks 断点ModelCheckpoint教程就是小编分享给大家的全部内容了，希望能给大家一个参考，也希望大家多多支持三水点靠木。

keras 回调函数Callbacks 断点ModelCheckpoint教程

- Author -

jieshaoxiansen

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

wxpython中自定义事件的实现与使用方法分析

Jul 21 Python

Python中对象迭代与反迭代的技巧总结

Sep 17 Python

JPype实现在python中调用JAVA的实例

Jul 19 Python

python读取excel表格生成erlang数据

Aug 26 Python

python实现八大排序算法（2）

Sep 14 Python

tensorflow 使用flags定义命令行参数的方法

Apr 23 Python

python取余运算符知识点详解

Jun 27 Python

django 中的聚合函数，分组函数，F 查询，Q查询

Jul 25 Python

Django后台管理系统的图文使用教学

Jan 20 Python

python操作链表的示例代码

Sep 27 Python

Python3使用tesserocr识别字母数字验证码的实现

Jan 29 Python

Python编写nmap扫描工具

Jul 21 Python

浅谈keras.callbacks设置模型保存策略

Jun 18 #Python

用python实现名片管理系统

Jun 18 #Python

Python 为什么推荐蛇形命名法原因浅析

Jun 18 #Python

python退出循环的方法

Jun 18 #Python

keras实现多GPU或指定GPU的使用介绍

Jun 17 #Python

Python字符串格式化常用手段及注意事项

Jun 17 #Python

python代码区分大小写吗

Jun 17 #Python

图片模糊(1) canvas(2) 选择器(1) #{}(1) GNN(1) flex(1) flex-shrink(1) SQL注入(2) 代理(2) 外键(1)

You might like

用Zend Encode编写开发PHP程序

2006/10/09 PHP

php ios推送(代码)

2013/07/01 PHP

Symfony数据校验方法实例分析

2015/01/26 PHP

PHP数据对象PDO操作技巧小结

2016/09/27 PHP

phpMyAdmin通过密码漏洞留后门文件

2018/11/20 PHP

JavaScript对象模型-执行模型

2008/04/28 Javascript

jquery ready函数、css函数及text()使用示例

2013/09/27 Javascript

jQuery简单实现遍历数组的方法

2015/04/14 Javascript

js生成随机颜色方法代码分享（三种）

2016/12/29 Javascript

jQuery 判断元素整理汇总

2017/02/28 Javascript

ES6中Proxy代理用法实例浅析

2017/04/06 Javascript

简单的vuex 的使用案例笔记

2018/04/13 Javascript

原生JS实现轮播图效果

2018/10/12 Javascript

[原创]微信小程序获取网络类型的方法示例

2019/03/01 Javascript

LayUI动态设置checkbox不显示的解决方法

2019/09/02 Javascript

基于小程序请求接口wx.request封装的类axios请求

2020/07/02 Javascript

vue中解决拖拽改变存在iframe的div大小时卡顿问题

2020/07/22 Javascript

[50:01]Ti4 冒泡赛第二天 NEWBEE vs Titan

2014/07/15 DOTA

Python实现抓取网页并且解析的实例

2014/09/20 Python

python通过BF算法实现关键词匹配的方法

2015/03/13 Python

Python 文件操作的详解及实例

2017/09/18 Python

python实现单向链表详解

2018/02/08 Python

对Python的多进程锁的使用方法详解

2019/02/18 Python

Python实现带下标索引的遍历操作示例

2019/05/30 Python

在django admin中添加自定义视图的例子

2019/07/26 Python

Python 50行爬虫抓取并处理图灵书目过程详解

2019/09/20 Python

如何快速理解python的垃圾回收机制

2020/09/01 Python

凯伦·米莲女装网上商店：Karen Millen

2017/11/07 全球购物

教师的实习自我鉴定

2013/12/17 职场文书

关于迟到的检讨书

2014/01/26 职场文书

国窖1573广告词

2014/03/21 职场文书

党员公开承诺书和承诺事项

2014/03/25 职场文书

父母对孩子的寄语

2014/04/09 职场文书

房屋出租协议书

2014/04/10 职场文书

体操比赛口号

2014/06/10 职场文书

使用Html+Css实现简易导航栏功能(导航栏遇到鼠标切换背景颜色)

2021/04/07 HTML / CSS