Pytorch中Tensor与各种图像格式的相互转化详解


Posted in Python onDecember 26, 2019

前言

在pytorch中经常会遇到图像格式的转化,例如将PIL库读取出来的图片转化为Tensor,亦或者将Tensor转化为numpy格式的图片。而且使用不同图像处理库读取出来的图片格式也不相同,因此,如何在pytorch中正确转化各种图片格式(PIL、numpy、Tensor)是一个在调试中比较重要的问题。

本文主要说明在pytorch中如何正确将图片格式在各种图像库读取格式以及tensor向量之间转化的问题。以下代码经过测试都可以在Pytorch-0.4.0或0.3.0版本直接使用。

对python不同的图像库读取格式有疑问可以看这里:https://3water.com/article/177288.htm

格式转换

我们一般在pytorch或者python中处理的图像无非这几种格式:

  • PIL:使用python自带图像处理库读取出来的图片格式
  • numpy:使用python-opencv库读取出来的图片格式
  • tensor:pytorch中训练时所采取的向量格式(当然也可以说图片)

注意,之后的讲解图片格式皆为RGB三通道,24-bit真彩色,也就是我们平常使用的图片形式。

PIL与Tensor

PIL与Tensor的转换相对容易些,因为pytorch已经提供了相关的代码,我们只需要搭配使用即可:

所有代码都已经引用了(之后的代码省略引用部分):

import torch
from PIL import Image
import matplotlib.pyplot as plt

# loader使用torchvision中自带的transforms函数
loader = transforms.Compose([
  transforms.ToTensor()]) 

unloader = transforms.ToPILImage()

1 PIL读取图片转化为Tensor

# 输入图片地址
# 返回tensor变量
def image_loader(image_name):
  image = Image.open(image_name).convert('RGB')
  image = loader(image).unsqueeze(0)
  return image.to(device, torch.float)

2 将PIL图片转化为Tensor

# 输入PIL格式图片
# 返回tensor变量
def PIL_to_tensor(image):
  image = loader(image).unsqueeze(0)
  return image.to(device, torch.float)

3 Tensor转化为PIL图片

# 输入tensor变量
# 输出PIL格式图片
def tensor_to_PIL(tensor):
  image = tensor.cpu().clone()
  image = image.squeeze(0)
  image = unloader(image)
  return image

4 直接展示tensor格式图片

def imshow(tensor, title=None):
  image = tensor.cpu().clone() # we clone the tensor to not do changes on it
  image = image.squeeze(0) # remove the fake batch dimension
  image = unloader(image)
  plt.imshow(image)
  if title is not None:
    plt.title(title)
  plt.pause(0.001) # pause a bit so that plots are updated

5 直接保存tensor格式图片

def save_image(tensor, **para):
  dir = 'results'
  image = tensor.cpu().clone() # we clone the tensor to not do changes on it
  image = image.squeeze(0) # remove the fake batch dimension
  image = unloader(image)
  if not osp.exists(dir):
    os.makedirs(dir)
  image.save('results_{}/s{}-c{}-l{}-e{}-sl{:4f}-cl{:4f}.jpg'
        .format(num, para['style_weight'], para['content_weight'], para['lr'], para['epoch'],
            para['style_loss'], para['content_loss']))

numpy与Tensor

numpy格式是使用cv2,也就是python-opencv库读取出来的图片格式,需要注意的是用python-opencv读取出来的图片和使用PIL读取出来的图片数据略微不同,经测试用python-opencv读取出来的图片在训练时的效果比使用PIL读取出来的略差一些(详细过程之后发布)。

之后所有代码引用:

import cv2
import torch
import matplotlib.pyplot as plt

numpy转化为tensor

def toTensor(img):
  assert type(img) == np.ndarray,'the img type is {}, but ndarry expected'.format(type(img))
  img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)
  img = torch.from_numpy(img.transpose((2, 0, 1)))
  return img.float().div(255).unsqueeze(0) # 255也可以改为256

tensor转化为numpy

def tensor_to_np(tensor):
  img = tensor.mul(255).byte()
  img = img.cpu().numpy().squeeze(0).transpose((1, 2, 0))
  return img

展示numpy格式图片

def show_from_cv(img, title=None):
  img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)
  plt.figure()
  plt.imshow(img)
  if title is not None:
    plt.title(title)
  plt.pause(0.001)

展示tensor格式图片

def show_from_tensor(tensor, title=None):
  img = tensor.clone()
  img = tensor_to_np(img)
  plt.figure()
  plt.imshow(img)
  if title is not None:
    plt.title(title)
  plt.pause(0.001)

注意

上面介绍的都是一张图片的转化,如果是n张图片一起的话,只需要修改一下相应代码即可。

举个例子,将之前说过的修改略微修改一下即可:

# 将 N x H x W X C 的numpy格式图片转化为相应的tensor格式
def toTensor(img):
  img = torch.from_numpy(img.transpose((0, 3, 1, 2)))
  return img.float().div(255).unsqueeze(0)

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
小结Python用fork来创建子进程注意事项
Jul 03 Python
python基于BeautifulSoup实现抓取网页指定内容的方法
Jul 09 Python
详解Django缓存处理中Vary头部的使用
Jul 24 Python
利用selenium 3.7和python3添加cookie模拟登陆的实现
Nov 20 Python
pyQt4实现俄罗斯方块游戏
Jun 26 Python
详解Django中间件的5种自定义方法
Jul 26 Python
基于树莓派的语音对话机器人
Jun 17 Python
Python使用pyserial进行串口通信的实例
Jul 02 Python
Python 图像处理: 生成二维高斯分布蒙版的实例
Jul 04 Python
浅析NumPy 切片和索引
Sep 02 Python
Python读取Excel一列并计算所有对象出现次数的方法
Sep 04 Python
python爬虫利器之requests库的用法(超全面的爬取网页案例)
Dec 17 Python
基于h5py的使用及数据封装代码
Dec 26 #Python
python深copy和浅copy区别对比解析
Dec 26 #Python
详解python opencv、scikit-image和PIL图像处理库比较
Dec 26 #Python
torch 中各种图像格式转换的实现方法
Dec 26 #Python
python两个_多个字典合并相加的实例代码
Dec 26 #Python
Python时间差中seconds和total_seconds的区别详解
Dec 26 #Python
python requests模拟登陆github的实现方法
Dec 26 #Python
You might like
PHP5中使用DOM控制XML实现代码
2010/05/07 PHP
php去除重复字的实现代码
2011/09/16 PHP
关于ThinkPHP中的异常处理详解
2018/05/11 PHP
分析 JavaScript 中令人困惑的变量赋值
2007/08/13 Javascript
jQuery对象[0]是什么含义?
2010/07/31 Javascript
JS的replace方法介绍
2012/10/20 Javascript
input输入框的自动匹配(原生代码)
2013/03/19 Javascript
Jquery实现视频播放页面的关灯开灯效果
2013/05/27 Javascript
js innerHTML 改变div内容的方法
2013/08/03 Javascript
jQuery EasyUI 布局之动态添加tabs标签页
2015/11/18 Javascript
深入理解JS函数的参数(arguments)的使用
2016/05/28 Javascript
JavaScript获取键盘按键的键码(参照表)
2017/01/10 Javascript
轻松学习Javascript闭包
2017/03/01 Javascript
深究AngularJS如何获取input的焦点(自定义指令)
2017/06/12 Javascript
Vue computed计算属性的使用方法
2017/07/14 Javascript
浅谈Node.js CVE-2017-14849 漏洞分析(详细步骤)
2017/11/10 Javascript
nodejs 生成和导出 word的实例代码
2018/07/31 NodeJs
vue2.0实现的tab标签切换效果(内容可自定义)示例
2019/02/11 Javascript
Vue实现滑动拼图验证码功能
2019/09/15 Javascript
关于JS模块化的知识点分享
2019/10/16 Javascript
vue样式穿透 ::v-deep的具体使用
2020/06/04 Javascript
[01:04:39]OG vs Mineski 2018国际邀请赛小组赛BO2 第二场 8.17
2018/08/18 DOTA
[45:17]DOTA2-DPC中国联赛定级赛 Phoenix vs DLG BO3第三场 1月9日
2021/03/11 DOTA
python遍历一个目录,输出所有的文件名的实例
2018/04/23 Python
python图像处理入门(一)
2019/04/04 Python
利用ImageAI库只需几行python代码实现目标检测
2019/08/09 Python
Python依赖包整体迁移方法详解
2019/08/15 Python
新年福利来一波之Python轻松集齐五福(demo)
2020/01/20 Python
python标准库OS模块函数列表与实例全解
2020/03/10 Python
简述数组与指针的区别
2014/01/02 面试题
施工资料员岗位职责
2014/01/06 职场文书
幼儿园教师奖惩制度
2014/02/01 职场文书
中学生获奖感言
2014/02/04 职场文书
国家税务局领导班子对照检查材料思想汇报
2014/10/04 职场文书
假释思想汇报范文
2014/10/11 职场文书
2014年办公室个人工作总结
2014/11/12 职场文书