pytorch多进程加速及代码优化方法


Posted in Python onAugust 19, 2019

目标:优化代码,利用多进程,进行近实时预处理、网络预测及后处理:

本人尝试了pytorch的multiprocessing,进行多进程同步处理以上任务。

from torch.multiprocessing import Pool,Manager

为了进行各进程间的通信,使用Queue,作为数据传输载体。

manager = Manager()
  input_queue = manager.Queue()
  output_queue = manager.Queue()

  show_queue = manager.Queue()

即将预处理进程处理后的图像放进 input_queue,而网络预测进程实时获取 input_queue队列中的数据,一旦放入,就从中取出,输入网络:

while 1:

  input = input_queue.get()

同理,将网络输出放入output_queue,再由后处理进程实时获取并进行后处理,处理后,放入show_queue

从而实现了多进程同步进行预处理、网络预测及后处理,加速了网络实时预测的表现。

问题及解决方案:

1. pytorch cuda报错,re-initialization报错问题:

习惯了在一开始将模型先加载进来放入gpu中,所以模型在主线程就完成了初始化,但是调用网络是在网络预测子进程进行的,就会导致跨进程重复初始化失败。

解决方案:

直接在子进程开始时初始化,其他进程可以设置个延时,等网络初始化好后再开始运行。

同理,数据输入网络也是同样的在子进程进行。

2. python3多进程编程,子进程不报错问题:

一开始总是代码运行起来什么都不出现,就开始各种debug,但因为python3中子进程不报错,出错了就卡在那里,就每次自己找bug很麻烦,所以就急需子进程的报错信息。

解决方案:

用try except组合,来打印子进程中某段程序错误,如下:

try:
        out = forward(input_img,model,1)
      except Exception as error:
        print(error)

3.进程完全不运行时,考虑是否是输入设置的问题,即当单变量输入时,后面要加都好,如:

pool.apply_async(load_frame,args=(input_queue,))

如果是pool.apply_async(load_frame,args=(input_queue))则该进程不会启动运行。

4. 一开始想优化cv2.resize,想用gpu下的tensor的resize_代替,但发现这种方式和numpy.resize一脉相承啊,根本不是我们想要的resize,如果是变大的话,这种resize会直接按顺序填,然后剩下的就填0,实在是太草率了。。。

解决方案:还没有很好的替代方案,只找了一下,cuda::resize,但是好像貌似没有python接口,要是混合编程好像有点小题大做,得不偿失了。如果各位有较好的方案,欢迎指点迷津。

以上这篇pytorch多进程加速及代码优化方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
深入讲解Python中面向对象编程的相关知识
May 25 Python
python使用str & repr转换字符串
Oct 13 Python
Django入门使用示例
Dec 12 Python
利用python将pdf输出为txt的实例讲解
Apr 23 Python
Python 读取指定文件夹下的所有图像方法
Apr 27 Python
Python基于opencv的图像压缩算法实例分析
May 03 Python
python3中替换python2中cmp函数的实现
Aug 20 Python
Python 仅获取响应头, 不获取实体的实例
Aug 21 Python
django 简单实现登录验证给你
Nov 06 Python
Python实现AI换脸功能
Apr 10 Python
Pyhton模块和包相关知识总结
May 12 Python
一篇文章带你搞懂Python类的相关知识
May 20 Python
用Pytorch训练CNN(数据集MNIST,使用GPU的方法)
Aug 19 #Python
python opencv实现证件照换底功能
Aug 19 #Python
解决pytorch GPU 计算过程中出现内存耗尽的问题
Aug 19 #Python
将Pytorch模型从CPU转换成GPU的实现方法
Aug 19 #Python
pytorch 使用单个GPU与多个GPU进行训练与测试的方法
Aug 19 #Python
在pytorch中为Module和Tensor指定GPU的例子
Aug 19 #Python
pytorch使用指定GPU训练的实例
Aug 19 #Python
You might like
浅谈PHP与C#的值类型指向区别的详解
2013/05/21 PHP
destoon调用自定义模板及样式的公告栏
2014/06/21 PHP
php防止伪造数据从地址栏URL提交的方法
2014/08/24 PHP
PHP cURL初始化和执行方法入门级代码
2015/05/28 PHP
分享3个php获取日历的函数
2015/09/25 PHP
php实现文件管理与基础功能操作
2017/03/21 PHP
使用WAMP搭建PHP本地开发环境
2017/05/10 PHP
PHP对称加密算法(DES/AES)类的实现代码
2017/11/14 PHP
PHP实现绘制二叉树图形显示功能详解【包括二叉搜索树、平衡树及红黑树】
2017/11/16 PHP
按给定几率进行随机抽取的js代码
2010/12/28 Javascript
Fixie.js 自动填充内容的插件
2012/06/28 Javascript
Flexigrid在IE下不显示数据的处理的解决方法
2013/10/24 Javascript
js操纵dom生成下拉列表框的方法
2014/02/24 Javascript
JS实现鼠标经过好友列表中的好友头像时显示资料卡的效果
2014/07/02 Javascript
JS不能跨域借助jquery获取IP地址的方法
2014/08/20 Javascript
js+CSS实现模拟华丽的select控件下拉菜单效果
2015/09/01 Javascript
jQuery插件zTree实现更新根节点中第i个节点名称的方法示例
2017/03/08 Javascript
深入理解JavaScript的值传递和引用传递
2018/10/24 Javascript
微信小程序开发之点击按钮退出小程序的实现方法
2019/04/26 Javascript
javascript实现自由编辑图片代码详解
2019/06/21 Javascript
JS面向对象编程实现的Tab选项卡案例详解
2020/03/03 Javascript
[02:58]魔廷新尊——痛苦女王至宝语音台词节选
2020/06/14 DOTA
从零学Python之入门(二)基本数据类型
2014/05/25 Python
Tensorflow实现AlexNet卷积神经网络及运算时间评测
2018/05/24 Python
pytorch多GPU并行运算的实现
2019/09/27 Python
python正则表达式实例代码
2020/03/03 Python
获取python运行输出的数据并解析存为dataFrame实例
2020/07/07 Python
Python实现AES加密,解密的两种方法
2020/10/03 Python
Python jieba库分词模式实例用法
2021/01/13 Python
CAT鞋美国官网:CAT Footwear
2017/11/27 全球购物
分厂厂长岗位职责
2013/12/29 职场文书
初一家长会邀请函
2014/01/31 职场文书
村级换届选举方案
2014/05/10 职场文书
七年级思品教学反思
2016/02/20 职场文书
React配置子路由的实现
2021/06/03 Javascript
Win11跳过联网界面创建本地管理账户的3种方法
2022/04/20 数码科技