Pytorch中Tensor与各种图像格式的相互转化详解


Posted in Python onDecember 26, 2019

前言

在pytorch中经常会遇到图像格式的转化,例如将PIL库读取出来的图片转化为Tensor,亦或者将Tensor转化为numpy格式的图片。而且使用不同图像处理库读取出来的图片格式也不相同,因此,如何在pytorch中正确转化各种图片格式(PIL、numpy、Tensor)是一个在调试中比较重要的问题。

本文主要说明在pytorch中如何正确将图片格式在各种图像库读取格式以及tensor向量之间转化的问题。以下代码经过测试都可以在Pytorch-0.4.0或0.3.0版本直接使用。

对python不同的图像库读取格式有疑问可以看这里:https://3water.com/article/177288.htm

格式转换

我们一般在pytorch或者python中处理的图像无非这几种格式:

  • PIL:使用python自带图像处理库读取出来的图片格式
  • numpy:使用python-opencv库读取出来的图片格式
  • tensor:pytorch中训练时所采取的向量格式(当然也可以说图片)

注意,之后的讲解图片格式皆为RGB三通道,24-bit真彩色,也就是我们平常使用的图片形式。

PIL与Tensor

PIL与Tensor的转换相对容易些,因为pytorch已经提供了相关的代码,我们只需要搭配使用即可:

所有代码都已经引用了(之后的代码省略引用部分):

import torch
from PIL import Image
import matplotlib.pyplot as plt

# loader使用torchvision中自带的transforms函数
loader = transforms.Compose([
  transforms.ToTensor()]) 

unloader = transforms.ToPILImage()

1 PIL读取图片转化为Tensor

# 输入图片地址
# 返回tensor变量
def image_loader(image_name):
  image = Image.open(image_name).convert('RGB')
  image = loader(image).unsqueeze(0)
  return image.to(device, torch.float)

2 将PIL图片转化为Tensor

# 输入PIL格式图片
# 返回tensor变量
def PIL_to_tensor(image):
  image = loader(image).unsqueeze(0)
  return image.to(device, torch.float)

3 Tensor转化为PIL图片

# 输入tensor变量
# 输出PIL格式图片
def tensor_to_PIL(tensor):
  image = tensor.cpu().clone()
  image = image.squeeze(0)
  image = unloader(image)
  return image

4 直接展示tensor格式图片

def imshow(tensor, title=None):
  image = tensor.cpu().clone() # we clone the tensor to not do changes on it
  image = image.squeeze(0) # remove the fake batch dimension
  image = unloader(image)
  plt.imshow(image)
  if title is not None:
    plt.title(title)
  plt.pause(0.001) # pause a bit so that plots are updated

5 直接保存tensor格式图片

def save_image(tensor, **para):
  dir = 'results'
  image = tensor.cpu().clone() # we clone the tensor to not do changes on it
  image = image.squeeze(0) # remove the fake batch dimension
  image = unloader(image)
  if not osp.exists(dir):
    os.makedirs(dir)
  image.save('results_{}/s{}-c{}-l{}-e{}-sl{:4f}-cl{:4f}.jpg'
        .format(num, para['style_weight'], para['content_weight'], para['lr'], para['epoch'],
            para['style_loss'], para['content_loss']))

numpy与Tensor

numpy格式是使用cv2,也就是python-opencv库读取出来的图片格式,需要注意的是用python-opencv读取出来的图片和使用PIL读取出来的图片数据略微不同,经测试用python-opencv读取出来的图片在训练时的效果比使用PIL读取出来的略差一些(详细过程之后发布)。

之后所有代码引用:

import cv2
import torch
import matplotlib.pyplot as plt

numpy转化为tensor

def toTensor(img):
  assert type(img) == np.ndarray,'the img type is {}, but ndarry expected'.format(type(img))
  img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)
  img = torch.from_numpy(img.transpose((2, 0, 1)))
  return img.float().div(255).unsqueeze(0) # 255也可以改为256

tensor转化为numpy

def tensor_to_np(tensor):
  img = tensor.mul(255).byte()
  img = img.cpu().numpy().squeeze(0).transpose((1, 2, 0))
  return img

展示numpy格式图片

def show_from_cv(img, title=None):
  img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)
  plt.figure()
  plt.imshow(img)
  if title is not None:
    plt.title(title)
  plt.pause(0.001)

展示tensor格式图片

def show_from_tensor(tensor, title=None):
  img = tensor.clone()
  img = tensor_to_np(img)
  plt.figure()
  plt.imshow(img)
  if title is not None:
    plt.title(title)
  plt.pause(0.001)

注意

上面介绍的都是一张图片的转化,如果是n张图片一起的话,只需要修改一下相应代码即可。

举个例子,将之前说过的修改略微修改一下即可:

# 将 N x H x W X C 的numpy格式图片转化为相应的tensor格式
def toTensor(img):
  img = torch.from_numpy(img.transpose((0, 3, 1, 2)))
  return img.float().div(255).unsqueeze(0)

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python在windows和linux下获得本机本地ip地址方法小结
Mar 20 Python
python实现的守护进程(Daemon)用法实例
Jun 02 Python
Python本地与全局命名空间用法实例
Jun 16 Python
python中快速进行多个字符替换的方法小结
Dec 15 Python
python 简单的绘图工具turtle使用详解
Jun 21 Python
Python基于回溯法子集树模板解决全排列问题示例
Sep 07 Python
Python wxPython库使用wx.ListBox创建列表框示例
Sep 03 Python
python 利用pandas将arff文件转csv文件的方法
Feb 12 Python
python threading和multiprocessing模块基本用法实例分析
Jul 25 Python
使用NumPy读取MNIST数据的实现代码示例
Nov 20 Python
Python递归求出列表(包括列表中的子列表)的最大值实例
Feb 27 Python
Python图片处理之图片裁剪教程
May 27 Python
基于h5py的使用及数据封装代码
Dec 26 #Python
python深copy和浅copy区别对比解析
Dec 26 #Python
详解python opencv、scikit-image和PIL图像处理库比较
Dec 26 #Python
torch 中各种图像格式转换的实现方法
Dec 26 #Python
python两个_多个字典合并相加的实例代码
Dec 26 #Python
Python时间差中seconds和total_seconds的区别详解
Dec 26 #Python
python requests模拟登陆github的实现方法
Dec 26 #Python
You might like
PHP的类 功能齐全的发送邮件类
2006/10/09 PHP
PHP读取ACCESS数据到MYSQL的代码
2011/05/11 PHP
php获取当前时间的毫秒数的方法
2014/01/26 PHP
php使用filter_var函数判断邮箱,url,ip格式示例
2019/07/06 PHP
PHP递归统计系统中代码行数
2019/09/19 PHP
用js实现手把手教你月入万刀(转贴)
2007/11/07 Javascript
js 多浏览器分别判断代码
2010/04/01 Javascript
javascript 事件处理、鼠标拖动效果实现方法详解
2012/05/11 Javascript
jQuery学习笔记之jQuery构建函数的7种方法
2014/06/03 Javascript
JavaScript实现把rgb颜色转换成16进制颜色的方法
2015/06/01 Javascript
jquery判断当前浏览器的实现代码
2015/11/07 Javascript
jQuery zTree树插件动态加载实例代码
2017/05/11 jQuery
浅谈Vuejs Prop基本用法
2017/08/17 Javascript
详解Javascript 中的 class、构造函数、工厂函数
2017/12/20 Javascript
vue cli安装使用less的教程详解
2019/07/12 Javascript
Node4-5静态资源服务器实战以及优化压缩文件实例内容
2019/08/29 Javascript
浅谈vue中使用编辑器vue-quill-editor踩过的坑
2020/08/03 Javascript
在vue中实现某一些路由页面隐藏导航栏的功能操作
2020/09/21 Javascript
详解JavaScript中分解数字的三种方法
2021/01/05 Javascript
Python实现的数据结构与算法之链表详解
2015/04/22 Python
Python编写简单的HTML页面合并脚本
2016/07/11 Python
浅谈numpy数组的几种排序方式
2017/12/15 Python
numpy和pandas中数组的合并、拉直和重塑实例
2019/06/28 Python
Python Selenium 之数据驱动测试的实现
2019/08/01 Python
python中Lambda表达式详解
2019/11/20 Python
Python逐行读取文件内容的方法总结
2020/02/14 Python
Python+Django+MySQL实现基于Web版的增删改查的示例代码
2020/05/13 Python
scrapy结合selenium解析动态页面的实现
2020/09/28 Python
药剂学专业应届生自荐信
2013/09/29 职场文书
鲜果饮品店创业计划书
2014/01/21 职场文书
安全保证书范文
2014/04/29 职场文书
人力资源管理专业求职信
2014/07/23 职场文书
2014最新实习证明模板
2014/10/02 职场文书
董存瑞观后感
2015/06/11 职场文书
JavaScript严格模式不支持八进制的问题讲解
2021/11/07 Javascript
详解Python flask的前后端交互
2022/03/31 Python