pytorch多进程加速及代码优化方法


Posted in Python onAugust 19, 2019

目标:优化代码,利用多进程,进行近实时预处理、网络预测及后处理:

本人尝试了pytorch的multiprocessing,进行多进程同步处理以上任务。

from torch.multiprocessing import Pool,Manager

为了进行各进程间的通信,使用Queue,作为数据传输载体。

manager = Manager()
  input_queue = manager.Queue()
  output_queue = manager.Queue()

  show_queue = manager.Queue()

即将预处理进程处理后的图像放进 input_queue,而网络预测进程实时获取 input_queue队列中的数据,一旦放入,就从中取出,输入网络:

while 1:

  input = input_queue.get()

同理,将网络输出放入output_queue,再由后处理进程实时获取并进行后处理,处理后,放入show_queue

从而实现了多进程同步进行预处理、网络预测及后处理,加速了网络实时预测的表现。

问题及解决方案:

1. pytorch cuda报错,re-initialization报错问题:

习惯了在一开始将模型先加载进来放入gpu中,所以模型在主线程就完成了初始化,但是调用网络是在网络预测子进程进行的,就会导致跨进程重复初始化失败。

解决方案:

直接在子进程开始时初始化,其他进程可以设置个延时,等网络初始化好后再开始运行。

同理,数据输入网络也是同样的在子进程进行。

2. python3多进程编程,子进程不报错问题:

一开始总是代码运行起来什么都不出现,就开始各种debug,但因为python3中子进程不报错,出错了就卡在那里,就每次自己找bug很麻烦,所以就急需子进程的报错信息。

解决方案:

用try except组合,来打印子进程中某段程序错误,如下:

try:
        out = forward(input_img,model,1)
      except Exception as error:
        print(error)

3.进程完全不运行时,考虑是否是输入设置的问题,即当单变量输入时,后面要加都好,如:

pool.apply_async(load_frame,args=(input_queue,))

如果是pool.apply_async(load_frame,args=(input_queue))则该进程不会启动运行。

4. 一开始想优化cv2.resize,想用gpu下的tensor的resize_代替,但发现这种方式和numpy.resize一脉相承啊,根本不是我们想要的resize,如果是变大的话,这种resize会直接按顺序填,然后剩下的就填0,实在是太草率了。。。

解决方案:还没有很好的替代方案,只找了一下,cuda::resize,但是好像貌似没有python接口,要是混合编程好像有点小题大做,得不偿失了。如果各位有较好的方案,欢迎指点迷津。

以上这篇pytorch多进程加速及代码优化方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
vc6编写python扩展的方法分享
Jan 17 Python
Python中的字符串操作和编码Unicode详解
Jan 18 Python
wxPython实现窗口用图片做背景
Apr 25 Python
Python3中正则模块re.compile、re.match及re.search函数用法详解
Jun 11 Python
python实现简单flappy bird
Dec 24 Python
在Python中,不用while和for循环遍历列表的实例
Feb 20 Python
Python使用指定端口进行http请求的例子
Jul 25 Python
用Pelican搭建一个极简静态博客系统过程解析
Aug 22 Python
pytorch 实现tensor与numpy数组转换
Dec 27 Python
关于torch.optim的灵活使用详解(包括重写SGD,加上L1正则)
Feb 20 Python
Tensorflow之梯度裁剪的实现示例
Mar 08 Python
用Python提取PDF表格的方法
Apr 11 Python
用Pytorch训练CNN(数据集MNIST,使用GPU的方法)
Aug 19 #Python
python opencv实现证件照换底功能
Aug 19 #Python
解决pytorch GPU 计算过程中出现内存耗尽的问题
Aug 19 #Python
将Pytorch模型从CPU转换成GPU的实现方法
Aug 19 #Python
pytorch 使用单个GPU与多个GPU进行训练与测试的方法
Aug 19 #Python
在pytorch中为Module和Tensor指定GPU的例子
Aug 19 #Python
pytorch使用指定GPU训练的实例
Aug 19 #Python
You might like
《魔兽争霸3:重制版》翻车了?你想要的我们都没有
2019/11/07 魔兽争霸
理解PHP5中static和const关键字的区别
2007/03/19 PHP
php获取从百度搜索进入网站的关键词的详细代码
2014/01/08 PHP
php带抄送和密件抄送的邮件发送方法
2015/03/20 PHP
PHP 获取ip地址代码汇总
2015/07/05 PHP
File, FileReader 和 Ajax 文件上传实例分析(php)
2011/04/27 Javascript
Javascript中引用示例介绍
2014/02/21 Javascript
让alert不出现弹窗的两种方法
2014/05/18 Javascript
JSONP之我见
2015/03/24 Javascript
jQuery插件pagination实现分页特效
2015/04/12 Javascript
jQuery实现的文字hover颜色渐变效果实例
2016/02/20 Javascript
JS动态创建元素的两种方法
2016/04/20 Javascript
详解Angular 中 ngOnInit 和 constructor 使用场景
2017/06/22 Javascript
小程序如何构建骨架屏
2019/05/29 Javascript
bootstrap table.js动态填充单元格数据的多种方法
2019/07/18 Javascript
vue项目部署到nginx/tomcat服务器的实现
2019/08/26 Javascript
总结Python中逻辑运算符的使用
2015/05/13 Python
python 如何快速找出两个电子表中数据的差异
2017/05/26 Python
Python3下错误AttributeError: ‘dict’ object has no attribute’iteritems‘的分析与解决
2017/07/06 Python
Python2和Python3中urllib库中urlencode的使用注意事项
2018/11/26 Python
详解Python locals()的陷阱
2019/03/26 Python
python绘制多个子图的实例
2019/07/07 Python
Tensorflow的梯度异步更新示例
2020/01/23 Python
pycharm软件实现设置自动保存操作
2020/06/08 Python
Python爬虫爬取ts碎片视频+验证码登录功能
2021/02/22 Python
CSS3 Flex 弹性布局实例代码详解
2018/11/01 HTML / CSS
HTML5重塑Web世界它将如何改变互联网
2012/12/17 HTML / CSS
使用HTML5 Geolocation实现一个距离追踪器
2018/04/09 HTML / CSS
欧洲最大的美妆零售网站:Feelunique
2017/01/14 全球购物
锐步美国官方网站:Reebok美国
2018/01/10 全球购物
JSF如何进行表格处理及取值
2012/08/06 面试题
是什么让J2EE适合用来开发多层的分布式的应用
2015/01/16 面试题
说明书怎么写
2014/05/06 职场文书
django注册用邮箱发送验证码的实现
2021/04/18 Python
vue使用echarts实现折线图
2022/03/21 Vue.js
解决MySQL报“too many connections“错误
2022/04/19 MySQL