pytorch多进程加速及代码优化方法


Posted in Python onAugust 19, 2019

目标:优化代码,利用多进程,进行近实时预处理、网络预测及后处理:

本人尝试了pytorch的multiprocessing,进行多进程同步处理以上任务。

from torch.multiprocessing import Pool,Manager

为了进行各进程间的通信,使用Queue,作为数据传输载体。

manager = Manager()
  input_queue = manager.Queue()
  output_queue = manager.Queue()

  show_queue = manager.Queue()

即将预处理进程处理后的图像放进 input_queue,而网络预测进程实时获取 input_queue队列中的数据,一旦放入,就从中取出,输入网络:

while 1:

  input = input_queue.get()

同理,将网络输出放入output_queue,再由后处理进程实时获取并进行后处理,处理后,放入show_queue

从而实现了多进程同步进行预处理、网络预测及后处理,加速了网络实时预测的表现。

问题及解决方案:

1. pytorch cuda报错,re-initialization报错问题:

习惯了在一开始将模型先加载进来放入gpu中,所以模型在主线程就完成了初始化,但是调用网络是在网络预测子进程进行的,就会导致跨进程重复初始化失败。

解决方案:

直接在子进程开始时初始化,其他进程可以设置个延时,等网络初始化好后再开始运行。

同理,数据输入网络也是同样的在子进程进行。

2. python3多进程编程,子进程不报错问题:

一开始总是代码运行起来什么都不出现,就开始各种debug,但因为python3中子进程不报错,出错了就卡在那里,就每次自己找bug很麻烦,所以就急需子进程的报错信息。

解决方案:

用try except组合,来打印子进程中某段程序错误,如下:

try:
        out = forward(input_img,model,1)
      except Exception as error:
        print(error)

3.进程完全不运行时,考虑是否是输入设置的问题,即当单变量输入时,后面要加都好,如:

pool.apply_async(load_frame,args=(input_queue,))

如果是pool.apply_async(load_frame,args=(input_queue))则该进程不会启动运行。

4. 一开始想优化cv2.resize,想用gpu下的tensor的resize_代替,但发现这种方式和numpy.resize一脉相承啊,根本不是我们想要的resize,如果是变大的话,这种resize会直接按顺序填,然后剩下的就填0,实在是太草率了。。。

解决方案:还没有很好的替代方案,只找了一下,cuda::resize,但是好像貌似没有python接口,要是混合编程好像有点小题大做,得不偿失了。如果各位有较好的方案,欢迎指点迷津。

以上这篇pytorch多进程加速及代码优化方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python 调用VC++的动态链接库(DLL)
Sep 06 Python
python中偏函数partial用法实例分析
Jul 08 Python
linux环境下的python安装过程图解(含setuptools)
Nov 22 Python
linux下python使用sendmail发送邮件
May 22 Python
python3第三方爬虫库BeautifulSoup4安装教程
Jun 19 Python
Python实现的简单排列组合算法示例
Jul 04 Python
Tensorflow实现部分参数梯度更新操作
Jan 23 Python
python实现在线翻译功能
Mar 03 Python
python 日志模块 日志等级设置失效的解决方案
May 26 Python
Python使用plt.boxplot() 参数绘制箱线图
Jun 04 Python
Python在线和离线安装第三方库的方法
Oct 31 Python
Django数据库迁移常见使用方法
Nov 12 Python
用Pytorch训练CNN(数据集MNIST,使用GPU的方法)
Aug 19 #Python
python opencv实现证件照换底功能
Aug 19 #Python
解决pytorch GPU 计算过程中出现内存耗尽的问题
Aug 19 #Python
将Pytorch模型从CPU转换成GPU的实现方法
Aug 19 #Python
pytorch 使用单个GPU与多个GPU进行训练与测试的方法
Aug 19 #Python
在pytorch中为Module和Tensor指定GPU的例子
Aug 19 #Python
pytorch使用指定GPU训练的实例
Aug 19 #Python
You might like
解析PHPExcel使用的常用说明以及把PHPExcel整合进CI框架的介绍
2013/06/24 PHP
php商品对比功能代码分享
2015/09/24 PHP
基于PHP给大家讲解防刷票的一些技巧
2015/11/18 PHP
js封装的textarea操作方法集合(兼容很好)
2010/11/16 Javascript
Javascript和HTML5利用canvas构建Web五子棋游戏实现算法
2013/07/17 Javascript
Jquery easyui 下loaing效果示例代码
2013/08/12 Javascript
jquery 为a标签绑定click事件示例代码
2014/06/23 Javascript
jQuery标签编辑插件Tagit使用指南
2015/04/21 Javascript
jQuery实现自动调整字体大小的方法
2015/06/15 Javascript
Bootstrap布局组件教程之Bootstrap下拉菜单
2016/06/12 Javascript
Vue过滤器的用法和自定义过滤器使用
2017/02/08 Javascript
JS仿淘宝搜索框用户输入事件的实现
2017/06/19 Javascript
深入理解Vue transition源码分析
2017/07/30 Javascript
在 Angular中 使用 Lodash 的方法
2018/02/11 Javascript
在vscode中统一vue编码风格的方法
2018/02/22 Javascript
在vue中获取微信支付code及code被占用问题的解决方法
2019/04/16 Javascript
Node.js API详解之 repl模块用法实例分析
2020/05/25 Javascript
[01:18]一目了然!DOTA2DotA快捷操作对比第一弹
2014/07/01 DOTA
linux系统使用python获取内存使用信息脚本分享
2014/01/15 Python
详解Python3中的Sequence type的使用
2015/08/01 Python
浅谈python 四种数值类型(int,long,float,complex)
2016/06/08 Python
python 爬虫 批量获取代理ip的实例代码
2018/05/22 Python
python 模拟创建seafile 目录操作示例
2019/09/26 Python
Python map及filter函数使用方法解析
2020/08/06 Python
Selenium+BeautifulSoup+json获取Script标签内的json数据
2020/12/07 Python
Pandas直接读取sql脚本的方法
2021/01/21 Python
英国布鲁姆精品店:Bloom Boutique
2018/03/01 全球购物
C#中类(class)与结构(struct)的异同
2013/11/03 面试题
毕业生自我鉴定实例
2014/01/21 职场文书
中学校庆方案
2014/03/17 职场文书
电教室标语
2014/06/20 职场文书
工作失职自我检讨书
2015/05/05 职场文书
焦点访谈观后感
2015/06/11 职场文书
关于React Native使用axios进行网络请求的方法
2021/08/02 Javascript
Redis读写分离搭建的完整步骤
2021/09/14 Redis
CSS作用域(样式分割)的使用汇总
2021/11/07 HTML / CSS