编程 Python

Pytorch转tflite方式

Posted in Python onMay 25, 2020

目标是想把在服务器上用pytorch训练好的模型转换为可以在移动端运行的tflite模型。

最直接的思路是想把pytorch模型转换为tensorflow的模型，然后转换为tflite。但是这个转换目前没有发现比较靠谱的方法。

经过调研发现最新的tflite已经支持直接从keras模型的转换，所以可以采用keras作为中间转换的桥梁，这样就能充分利用keras高层API的便利性。

转换的基本思想就是用pytorch中的各层网络的权重取出来后直接赋值给keras网络中的对应layer层的权重。

转换为Keras模型后，再通过tf.contrib.lite.TocoConverter把模型直接转为tflite.

下面是一个例子，假设转换的是一个两层的CNN网络。

import tensorflow as tf
from tensorflow import keras
import numpy as np

import torch
from torchvision import models
import torch.nn as nn
# import torch.nn.functional as F
from torch.autograd import Variable

class PytorchNet(nn.Module):
 def __init__(self):
 super(PytorchNet, self).__init__()
 conv1 = nn.Sequential(
  nn.Conv2d(3, 32, 3, 2),
  nn.BatchNorm2d(32),
  nn.ReLU(inplace=True),
  nn.MaxPool2d(2, 2))
 conv2 = nn.Sequential(
  nn.Conv2d(32, 64, 3, 1, groups=1),
  nn.BatchNorm2d(64),
  nn.ReLU(inplace=True),
  nn.MaxPool2d(2, 2))
 self.feature = nn.Sequential(conv1, conv2)
 self.init_weights()

 def forward(self, x):
 return self.feature(x)

 def init_weights(self):
 for m in self.modules():
  if isinstance(m, nn.Conv2d):
  nn.init.kaiming_normal_(
   m.weight.data, mode='fan_out', nonlinearity='relu')
  if m.bias is not None:
   m.bias.data.zero_()
  if isinstance(m, nn.BatchNorm2d):
  m.weight.data.fill_(1)
  m.bias.data.zero_()

def KerasNet(input_shape=(224, 224, 3)):
 image_input = keras.layers.Input(shape=input_shape)
 # conv1
 network = keras.layers.Conv2D(
 32, (3, 3), strides=(2, 2), padding="valid")(image_input)
 network = keras.layers.BatchNormalization(
 trainable=False, fused=False)(network)
 network = keras.layers.Activation("relu")(network)
 network = keras.layers.MaxPool2D(pool_size=(2, 2), strides=(2, 2))(network)

 # conv2
 network = keras.layers.Conv2D(
 64, (3, 3), strides=(1, 1), padding="valid")(network)
 network = keras.layers.BatchNormalization(
 trainable=False, fused=True)(network)
 network = keras.layers.Activation("relu")(network)
 network = keras.layers.MaxPool2D(pool_size=(2, 2), strides=(2, 2))(network)

 model = keras.Model(inputs=image_input, outputs=network)

 return model

class PytorchToKeras(object):
 def __init__(self, pModel, kModel):
 super(PytorchToKeras, self)
 self.__source_layers = []
 self.__target_layers = []
 self.pModel = pModel
 self.kModel = kModel
 tf.keras.backend.set_learning_phase(0)

 def __retrieve_k_layers(self):
 for i, layer in enumerate(self.kModel.layers):
  if len(layer.weights) > 0:
  self.__target_layers.append(i)

 def __retrieve_p_layers(self, input_size):

 input = torch.randn(input_size)
 input = Variable(input.unsqueeze(0))
 hooks = []

 def add_hooks(module):

  def hook(module, input, output):
  if hasattr(module, "weight"):
   # print(module)
   self.__source_layers.append(module)

  if not isinstance(module, nn.ModuleList) and not isinstance(module, nn.Sequential) and module != self.pModel:
  hooks.append(module.register_forward_hook(hook))

 self.pModel.apply(add_hooks)

 self.pModel(input)
 for hook in hooks:
  hook.remove()

 def convert(self, input_size):
 self.__retrieve_k_layers()
 self.__retrieve_p_layers(input_size)

 for i, (source_layer, target_layer) in enumerate(zip(self.__source_layers, self.__target_layers)):
  print(source_layer)
  weight_size = len(source_layer.weight.data.size())
  transpose_dims = []
  for i in range(weight_size):
  transpose_dims.append(weight_size - i - 1)
  if isinstance(source_layer, nn.Conv2d):
  transpose_dims = [2,3,1,0]
  self.kModel.layers[target_layer].set_weights([source_layer.weight.data.numpy(
  ).transpose(transpose_dims), source_layer.bias.data.numpy()])
  elif isinstance(source_layer, nn.BatchNorm2d):
  self.kModel.layers[target_layer].set_weights([source_layer.weight.data.numpy(), source_layer.bias.data.numpy(),
        source_layer.running_mean.data.numpy(), source_layer.running_var.data.numpy()])
 def save_model(self, output_file):
 self.kModel.save(output_file)

 def save_weights(self, output_file):
 self.kModel.save_weights(output_file, save_format='h5')

pytorch_model = PytorchNet()
keras_model = KerasNet(input_shape=(224, 224, 3))

torch.save(pytorch_model, 'test.pth')

#Load the pretrained model
pytorch_model = torch.load('test.pth')

# #Time to transfer weights
converter = PytorchToKeras(pytorch_model, keras_model)
converter.convert((3, 224, 224))

# #Save the converted keras model for later use
# converter.save_weights("keras.h5")
converter.save_model("keras_model.h5")

# convert keras model to tflite model
converter = tf.contrib.lite.TocoConverter.from_keras_model_file(
 "keras_model.h5")
tflite_model = converter.convert()
open("convert_model.tflite", "wb").write(tflite_model)

补充知识：tensorflow模型转换成tensorflow lite模型

1.把graph和网络模型打包在一个文件中

bazel build tensorflow/python/tools:freeze_graph && \
 bazel-bin/tensorflow/python/tools/freeze_graph \
 --input_graph=eval_graph_def.pb \
 --input_checkpoint=checkpoint \
 --output_graph=frozen_eval_graph.pb \
 --output_node_names=outputs

For example:

bazel-bin/tensorflow/python/tools/freeze_graph \ 
 --input_graph=./mobilenet_v1_1.0_224/mobilenet_v1_1.0_224_eval.pbtxt \
 --input_checkpoint=./mobilenet_v1_1.0_224/mobilenet_v1_1.0_224.ckpt \
 --output_graph=./mobilenet_v1_1.0_224/frozen_eval_graph_test.pb \
 --output_node_names=MobilenetV1/Predictions/Reshape_1

2.把第一步中生成的tensorflow pb模型转换为tf lite模型

转换前需要先编译转换工具

bazel build tensorflow/contrib/lite/toco:toco

转换分两种，一种的转换为float的tf lite，另一种可以转换为对模型进行unit8的量化版本的模型。两种方式如下：

非量化的转换：

./bazel-bin/third_party/tensorflow/contrib/lite/toco/toco \ 官网给的这个路径不对       
./bazel-bin/tensorflow/contrib/lite/toco/toco \         
 —input_file=./mobilenet_v1_1.0_224/frozen_eval_graph_test.pb \  
 —output_file=./mobilenet_v1_1.0_224/tflite_model_test.tflite \  
 --input_format=TENSORFLOW_GRAPHDEF --output_format=TFLITE \       
 --inference_type=FLOAT \           
 --input_shape="1,224, 224,3" \           
 --input_array=input \            
 --output_array=MobilenetV1/Predictions/Reshape_1

量化方式的转换(注意，只有量化训练的模型才能进行量化的tf_lite转换)：

./bazel-bin/third_party/tensorflow/contrib/lite/toco/toco \
./bazel-bin/tensorflow/contrib/lite/toco/toco \
 --input_file=frozen_eval_graph.pb \
 --output_file=tflite_model.tflite \
 --input_format=TENSORFLOW_GRAPHDEF --output_format=TFLITE \
 --inference_type=QUANTIZED_UINT8 \
 --input_shape="1,224, 224,3" \
 --input_array=input \
 --output_array=outputs \
 --std_value=127.5 --mean_value=127.5

以上这篇Pytorch转tflite方式就是小编分享给大家的全部内容了，希望能给大家一个参考，也希望大家多多支持三水点靠木。

Pytorch转tflite方式

- Author -

IT修道者

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

python 正则式概述及常用字符

May 07 Python

Python中使用支持向量机(SVM)算法

Dec 26 Python

浅谈python函数调用返回两个或多个变量的方法

Jan 23 Python

python+os根据文件名自动生成文本

Mar 21 Python

python opencv 读取图片返回图片某像素点的b,g,r值的实现方法

Jul 03 Python

使用Python刷淘宝喵币（低阶入门版）

Oct 30 Python

Transpose 数组行列转置的限制方式

Feb 11 Python

xadmin使用formfield_for_dbfield函数过滤下拉表单实例

Apr 07 Python

详解使用Python写一个向数据库填充数据的小工具(推荐)

Sep 11 Python

基于Python实现粒子滤波效果

Dec 01 Python

python中round函数保留两位小数的方法

Dec 04 Python

如何用 Python 制作 GitHub 消息助手

Feb 20 Python

Python HTMLTestRunner库安装过程解析

May 25 #Python

Anaconda＋vscode＋pytorch环境搭建过程详解

May 25 #Python

5行Python代码实现图像分割的步骤详解

May 25 #Python

Win10用vscode打开anaconda环境中的python出错问题的解决

May 25 #Python

keras .h5转移动端的.tflite文件实现方式

May 25 #Python

Python虚拟环境venv用法详解

May 25 #Python

将keras的h5模型转换为tensorflow的pb模型操作

May 25 #Python

You might like

PHP新手上路（十二）

2006/10/09 PHP

新手学PHP之数据库操作详解及乱码解决！

2007/01/02 PHP

从php核心代码分析require和include的区别

2011/01/02 PHP

PHP实现模拟http请求的方法分析

2017/12/20 PHP

页面只有一个text的时候，回车自动submit的解决方法

2010/08/12 Javascript

js自定义事件代码说明

2011/01/31 Javascript

基于jquery的仿百度搜索框效果代码

2011/04/11 Javascript

JS 操作符整理[推荐收藏]

2011/11/15 Javascript

解析JavaScript中delete操作符不能删除的对象

2013/12/03 Javascript

JSP中使用JavaScript动态插入删除输入框实现代码

2014/06/13 Javascript

jquery的ajax提交form表单的两种方法小结(推荐)

2016/05/25 Javascript

Bootstrap优化站点资源、响应式图片、传送带使用详解3

2016/10/14 Javascript

微信小程序开发(一) 微信登录流程详解

2017/01/11 Javascript

ng-options和ng-checked在表单中的高级运用(推荐)

2017/01/21 Javascript

jQuery实现动态生成表格并为行绑定单击变色动作的方法

2017/04/17 jQuery

Angular实现下载安装包的功能代码分享

2017/09/05 Javascript

nodejs实现超简单生成二维码的方法

2018/03/17 NodeJs

jquery实现垂直无限轮播的方法分析

2019/07/16 jQuery

[55:02]2014 DOTA2国际邀请赛中国区预选赛 HGT VS Orenda

2014/05/21 DOTA

python实现读取excel写入mysql的小工具详解

2017/11/20 Python

Python Tkinter模块实现时钟功能应用示例

2018/07/23 Python

python 使用plt画图,去除图片四周的白边方法

2019/07/09 Python

用Python实现最速下降法求极值的方法

2019/07/10 Python

python实现tail -f 功能

2020/01/17 Python

如何基于python实现归一化处理

2020/01/20 Python

使用python实现时间序列白噪声检验方式

2020/06/03 Python

Numpy 多维数据数组的实现

2020/06/18 Python

python Socket网络编程实现C/S模式和P2P

2020/06/22 Python

如何将anaconda安装配置的mmdetection环境离线拷贝到另一台电脑

2020/10/15 Python

美国在线购买内衣网站：HerRoom

2020/02/22 全球购物

市优秀教师事迹材料

2014/02/05 职场文书

伊索寓言教学反思

2014/05/01 职场文书

委托书的写法

2014/08/30 职场文书

股东授权委托书

2014/10/15 职场文书

React forwardRef的使用方法及注意点

2021/06/13 Javascript

nginx实现动静分离的方法示例

2021/11/07 Servers