编程 Python

浅谈Tensorflow模型的保存与恢复加载

Posted in Python onApril 26, 2018

近期做了一些反垃圾的工作，除了使用常用的规则匹配过滤等手段，也采用了一些机器学习方法进行分类预测。我们使用TensorFlow进行模型的训练，训练好的模型需要保存，预测阶段我们需要将模型进行加载还原使用，这就涉及TensorFlow模型的保存与恢复加载。

总结一下Tensorflow常用的模型保存方式。

保存checkpoint模型文件（.ckpt）

首先，TensorFlow提供了一个非常方便的api，tf.train.Saver()来保存和还原一个机器学习模型。

模型保存

使用tf.train.Saver()来保存模型文件非常方便，下面是一个简单的例子：

import tensorflow as tf
import os

def save_model_ckpt(ckpt_file_path):
  x = tf.placeholder(tf.int32, name='x')
  y = tf.placeholder(tf.int32, name='y')
  b = tf.Variable(1, name='b')
  xy = tf.multiply(x, y)
  op = tf.add(xy, b, name='op_to_store')

  sess = tf.Session()
  sess.run(tf.global_variables_initializer())

  path = os.path.dirname(os.path.abspath(ckpt_file_path))
  if os.path.isdir(path) is False:
    os.makedirs(path)

  tf.train.Saver().save(sess, ckpt_file_path)
  
  # test
  feed_dict = {x: 2, y: 3}
  print(sess.run(op, feed_dict))

程序生成并保存四个文件（在版本0.11之前只会生成三个文件：checkpoint, model.ckpt, model.ckpt.meta）

checkpoint 文本文件，记录了模型文件的路径信息列表
model.ckpt.data-00000-of-00001 网络权重信息
model.ckpt.index .data和.index这两个文件是二进制文件，保存了模型中的变量参数（权重）信息
model.ckpt.meta 二进制文件，保存了模型的计算图结构信息（模型的网络结构）protobuf

以上是tf.train.Saver().save()的基本用法，save()方法还有很多可配置的参数：

tf.train.Saver().save(sess, ckpt_file_path, global_step=1000)

加上global_step参数代表在每1000次迭代后保存模型，会在模型文件后加上"-1000"，model.ckpt-1000.index, model.ckpt-1000.meta, model.ckpt.data-1000-00000-of-00001

每1000次迭代保存一次模型，但是模型的结构信息文件不会变，就只用1000次迭代时保存一下，不用相应的每1000次保存一次，所以当我们不需要保存meta文件时，可以加上write_meta_graph=False参数，如下：

tf.train.Saver().save(sess, ckpt_file_path, global_step=1000, write_meta_graph=False)

如果想每两小时保存一次模型，并且只保存最新的4个模型，可以加上使用max_to_keep（默认值为5，如果想每训练一个epoch就保存一次，可以将其设置为None或0，但是没啥用不推荐）, keep_checkpoint_every_n_hours参数，如下：

tf.train.Saver().save(sess, ckpt_file_path, max_to_keep=4, keep_checkpoint_every_n_hours=2)

同时在tf.train.Saver()类中，如果我们不指定任何信息，则会保存所有的参数信息，我们也可以指定部分想要保存的内容，例如只保存x, y参数（可传入参数list或dict）：

tf.train.Saver([x, y]).save(sess, ckpt_file_path)

ps. 在模型训练过程中需要在保存后拿到的变量或参数名属性name不能丢，不然模型还原后不能通过get_tensor_by_name()获取。

模型加载还原

针对上面的模型保存例子，还原模型的过程如下：

import tensorflow as tf

def restore_model_ckpt(ckpt_file_path):
  sess = tf.Session()
  saver = tf.train.import_meta_graph('./ckpt/model.ckpt.meta') # 加载模型结构
  saver.restore(sess, tf.train.latest_checkpoint('./ckpt')) # 只需要指定目录就可以恢复所有变量信息

  # 直接获取保存的变量
  print(sess.run('b:0'))

  # 获取placeholder变量
  input_x = sess.graph.get_tensor_by_name('x:0')
  input_y = sess.graph.get_tensor_by_name('y:0')
  # 获取需要进行计算的operator
  op = sess.graph.get_tensor_by_name('op_to_store:0')

  # 加入新的操作
  add_on_op = tf.multiply(op, 2)

  ret = sess.run(add_on_op, {input_x: 5, input_y: 5})
  print(ret)

首先还原模型结构，然后还原变量（参数）信息，最后我们就可以获得已训练的模型中的各种信息了（保存的变量、placeholder变量、operator等），同时可以对获取的变量添加各种新的操作（见以上代码注释）。
并且，我们也可以加载部分模型，在此基础上加入其它操作，具体可以参考官方文档和demo。

针对ckpt模型文件的保存与还原，stackoverflow上有一个回答解释比较清晰，可以参考。

同时cv-tricks.com上面的TensorFlow模型保存与恢复的教程也非常好，可以参考。

以上就是本文的全部内容，希望对大家的学习有所帮助，也希望大家多多支持三水点靠木。

浅谈Tensorflow模型的保存与恢复加载

- Author -

lyyyyy

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

在Docker上开始部署Python应用的教程

Apr 17 Python

Python中isnumeric()方法的使用简介

May 19 Python

启动targetcli时遇到错误解决办法

Oct 26 Python

python验证码识别教程之利用投影法、连通域法分割图片

Jun 04 Python

Pandas DataFrame数据的更改、插入新增的列和行的方法

Jun 25 Python

python sqlite的Row对象操作示例

Sep 11 Python

python输入错误后删除的方法

Oct 12 Python

详解python tkinter模块安装过程

Jan 06 Python

python修改linux中文件(文件夹)的权限属性操作

Mar 05 Python

浅析Django 接收所有文件,前端展示文件（包括视频，文件，图片）ajax请求

Mar 09 Python

Django 允许局域网中的机器访问你的主机操作

May 13 Python

python 获取字典键值对的实现

Nov 12 Python

Python实现爬取百度贴吧帖子所有楼层图片的爬虫示例

Apr 26 #Python

Python实现的计算器功能示例

Apr 26 #Python

python email smtplib模块发送邮件代码实例

Apr 26 #Python

Python利用正则表达式实现计算器算法思路解析

Apr 25 #Python

Python实现随机生成手机号及正则验证手机号的方法

Apr 25 #Python

Python实现按中文排序的方法示例

Apr 25 #Python

Python实现的基于优先等级分配糖果问题算法示例

Apr 25 #Python

You might like

PHP curl实现抓取302跳转后页面的示例

2014/07/04 PHP

PHP浮点数的一个常见问题

2016/03/10 PHP

PHP版微信小店接口开发实例

2016/11/12 PHP

laravel通过创建自定义artisan make命令来新建类文件详解

2017/08/17 PHP

js调试工具 Javascript Debug Toolkit 2.0.0版本发布

2008/12/02 Javascript

js跑步算法的实现代码

2013/12/04 Javascript

JQuery的Ajax请求实现局部刷新的简单实例

2014/02/11 Javascript

用box固定长宽实现图片自动轮播js代码

2014/06/09 Javascript

字段太多jquey快速清空表单内容方法

2014/08/21 Javascript

js简单实现Select互换数据的方法

2015/08/17 Javascript

拥Bootstrap入怀——导航栏篇

2016/05/30 Javascript

AngularJS入门教程之服务(Service)

2016/07/27 Javascript

js实现tab选项卡切换功能

2017/01/13 Javascript

JavaScript、C# URL编码、解码总结

2017/01/21 Javascript

javascript 初学教程及五子棋小程序的简单实现

2017/07/04 Javascript

JS实现的全选、全不选及反选功能【案例】

2019/02/19 Javascript

了解在JavaScript中将值转换为字符串的5种方法

2019/06/06 Javascript

JavaScript中的相等操作符使用详解

2019/12/21 Javascript

javaScript实现一个队列的方法

2020/07/14 Javascript

python解析文件示例

2014/01/23 Python

Python Pandas中根据列的值选取多行数据

2019/07/08 Python

命令行运行Python脚本时传入参数的三种方式详解

2019/10/11 Python

Pycharm 2020年最新激活码（亲测有效）

2020/09/18 Python

Python读取VOC中的xml目标框实例

2020/03/10 Python

Python定时任务APScheduler原理及实例解析

2020/05/30 Python

浅谈如何使用python抓取网页中的动态数据实现

2020/08/17 Python

应届生体育教师自荐信

2013/10/03 职场文书

应届毕业生求职信

2013/11/30 职场文书

怎样写好自荐信和推荐信

2013/12/26 职场文书

公益广告宣传方案

2014/02/28 职场文书

委托公证书范本

2014/04/03 职场文书

督导岗位职责范本

2015/04/10 职场文书

党风廉洁教育心得体会

2016/01/20 职场文书

CSS变量实现主题切换的方法

2021/06/23 HTML / CSS

Mysql中一千万条数据怎么快速查询

2021/12/06 MySQL

最新动漫情报：2022年7月新番定档超过30部, OVERLORD骨王第四季也在其中噢

2022/05/04 日漫