pytorch多进程加速及代码优化方法


Posted in Python onAugust 19, 2019

目标:优化代码,利用多进程,进行近实时预处理、网络预测及后处理:

本人尝试了pytorch的multiprocessing,进行多进程同步处理以上任务。

from torch.multiprocessing import Pool,Manager

为了进行各进程间的通信,使用Queue,作为数据传输载体。

manager = Manager()
  input_queue = manager.Queue()
  output_queue = manager.Queue()

  show_queue = manager.Queue()

即将预处理进程处理后的图像放进 input_queue,而网络预测进程实时获取 input_queue队列中的数据,一旦放入,就从中取出,输入网络:

while 1:

  input = input_queue.get()

同理,将网络输出放入output_queue,再由后处理进程实时获取并进行后处理,处理后,放入show_queue

从而实现了多进程同步进行预处理、网络预测及后处理,加速了网络实时预测的表现。

问题及解决方案:

1. pytorch cuda报错,re-initialization报错问题:

习惯了在一开始将模型先加载进来放入gpu中,所以模型在主线程就完成了初始化,但是调用网络是在网络预测子进程进行的,就会导致跨进程重复初始化失败。

解决方案:

直接在子进程开始时初始化,其他进程可以设置个延时,等网络初始化好后再开始运行。

同理,数据输入网络也是同样的在子进程进行。

2. python3多进程编程,子进程不报错问题:

一开始总是代码运行起来什么都不出现,就开始各种debug,但因为python3中子进程不报错,出错了就卡在那里,就每次自己找bug很麻烦,所以就急需子进程的报错信息。

解决方案:

用try except组合,来打印子进程中某段程序错误,如下:

try:
        out = forward(input_img,model,1)
      except Exception as error:
        print(error)

3.进程完全不运行时,考虑是否是输入设置的问题,即当单变量输入时,后面要加都好,如:

pool.apply_async(load_frame,args=(input_queue,))

如果是pool.apply_async(load_frame,args=(input_queue))则该进程不会启动运行。

4. 一开始想优化cv2.resize,想用gpu下的tensor的resize_代替,但发现这种方式和numpy.resize一脉相承啊,根本不是我们想要的resize,如果是变大的话,这种resize会直接按顺序填,然后剩下的就填0,实在是太草率了。。。

解决方案:还没有很好的替代方案,只找了一下,cuda::resize,但是好像貌似没有python接口,要是混合编程好像有点小题大做,得不偿失了。如果各位有较好的方案,欢迎指点迷津。

以上这篇pytorch多进程加速及代码优化方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python魔法方法-自定义序列详解
Jul 21 Python
教你用Python创建微信聊天机器人
Mar 31 Python
python使用RNN实现文本分类
May 24 Python
用uWSGI和Nginx部署Flask项目的方法示例
May 05 Python
python 列表输出重复值以及对应的角标方法
Jun 11 Python
python利用tkinter实现屏保
Jul 30 Python
Python OpenCV图像指定区域裁剪的实现
Oct 30 Python
python编程进阶之异常处理用法实例分析
Feb 21 Python
Python新手学习raise用法
Jun 03 Python
python解释器安装教程的方法步骤
Jul 02 Python
python中pathlib模块的基本用法与总结
Aug 17 Python
python 实现围棋游戏(纯tkinter gui)
Nov 13 Python
用Pytorch训练CNN(数据集MNIST,使用GPU的方法)
Aug 19 #Python
python opencv实现证件照换底功能
Aug 19 #Python
解决pytorch GPU 计算过程中出现内存耗尽的问题
Aug 19 #Python
将Pytorch模型从CPU转换成GPU的实现方法
Aug 19 #Python
pytorch 使用单个GPU与多个GPU进行训练与测试的方法
Aug 19 #Python
在pytorch中为Module和Tensor指定GPU的例子
Aug 19 #Python
pytorch使用指定GPU训练的实例
Aug 19 #Python
You might like
php下一个阿拉伯数字转中文数字的函数
2007/07/16 PHP
php 提速工具eAccelerator 配置参数详解
2010/05/16 PHP
PHP中数组定义的几种方法
2013/09/01 PHP
ThinkPHP自动填充实现无限级分类的方法
2014/08/22 PHP
php使用fsockopen函数发送post,get请求获取网页内容的方法
2014/11/15 PHP
分享常见的几种页面静态化的方法
2015/01/08 PHP
Laravel 类和接口注入相关的代码
2019/10/15 PHP
javascript实现 在光标处插入指定内容
2007/05/25 Javascript
Extjs ajax同步请求时post方式参数发送方式
2009/08/05 Javascript
JS面向对象编程浅析
2011/08/28 Javascript
javascript中简单的进制转换代码实例
2013/10/26 Javascript
JavaScript 不支持 indexof 该如何解决
2016/03/30 Javascript
基于jQuery实现发送短信验证码后的倒计时功能(无视页面关闭)
2016/09/02 Javascript
需要牢记的JavaScript基础知识
2016/09/25 Javascript
详解如何在Vue2中实现组件props双向绑定
2017/03/29 Javascript
Vue键盘事件用法总结
2017/04/18 Javascript
通过命令行创建vue项目的方法
2017/07/20 Javascript
浅谈NodeJs之数据库异常处理
2017/10/25 NodeJs
详解如何解决Vue和vue-template-compiler版本之间的问题
2018/09/17 Javascript
vue如何安装使用Quill富文本编辑器
2018/09/21 Javascript
解决vue打包后刷新页面报错:Unexpected token
2019/08/27 Javascript
jQuery中getJSON跨域原理的深入讲解
2020/09/02 jQuery
利用node.js开发cli的完整步骤
2020/12/29 Javascript
python使用循环实现批量创建文件夹示例
2014/03/25 Python
Python利用正则表达式匹配并截取指定子串及去重的方法
2015/07/30 Python
python学习开发mock接口
2019/04/28 Python
利用python在大量数据文件下删除某一行的例子
2019/08/21 Python
python实现人像动漫化的示例代码
2020/05/17 Python
pymongo insert_many 批量插入的实例
2020/12/05 Python
美国全球旅游运营商:Pacific Holidays
2018/06/18 全球购物
迷你分体式空调:SoGoodToBuy
2018/08/07 全球购物
社会实践心得体会
2014/01/03 职场文书
幼儿园家长寄语
2014/04/02 职场文书
小学美术教学反思
2016/02/17 职场文书
《揠苗助长》教学反思
2016/02/20 职场文书
「租借女友」第2季樱泽墨角色PV&新视觉图公开
2022/03/21 日漫