Pytorch中Tensor与各种图像格式的相互转化详解


Posted in Python onDecember 26, 2019

前言

在pytorch中经常会遇到图像格式的转化,例如将PIL库读取出来的图片转化为Tensor,亦或者将Tensor转化为numpy格式的图片。而且使用不同图像处理库读取出来的图片格式也不相同,因此,如何在pytorch中正确转化各种图片格式(PIL、numpy、Tensor)是一个在调试中比较重要的问题。

本文主要说明在pytorch中如何正确将图片格式在各种图像库读取格式以及tensor向量之间转化的问题。以下代码经过测试都可以在Pytorch-0.4.0或0.3.0版本直接使用。

对python不同的图像库读取格式有疑问可以看这里:https://3water.com/article/177288.htm

格式转换

我们一般在pytorch或者python中处理的图像无非这几种格式:

  • PIL:使用python自带图像处理库读取出来的图片格式
  • numpy:使用python-opencv库读取出来的图片格式
  • tensor:pytorch中训练时所采取的向量格式(当然也可以说图片)

注意,之后的讲解图片格式皆为RGB三通道,24-bit真彩色,也就是我们平常使用的图片形式。

PIL与Tensor

PIL与Tensor的转换相对容易些,因为pytorch已经提供了相关的代码,我们只需要搭配使用即可:

所有代码都已经引用了(之后的代码省略引用部分):

import torch
from PIL import Image
import matplotlib.pyplot as plt

# loader使用torchvision中自带的transforms函数
loader = transforms.Compose([
  transforms.ToTensor()]) 

unloader = transforms.ToPILImage()

1 PIL读取图片转化为Tensor

# 输入图片地址
# 返回tensor变量
def image_loader(image_name):
  image = Image.open(image_name).convert('RGB')
  image = loader(image).unsqueeze(0)
  return image.to(device, torch.float)

2 将PIL图片转化为Tensor

# 输入PIL格式图片
# 返回tensor变量
def PIL_to_tensor(image):
  image = loader(image).unsqueeze(0)
  return image.to(device, torch.float)

3 Tensor转化为PIL图片

# 输入tensor变量
# 输出PIL格式图片
def tensor_to_PIL(tensor):
  image = tensor.cpu().clone()
  image = image.squeeze(0)
  image = unloader(image)
  return image

4 直接展示tensor格式图片

def imshow(tensor, title=None):
  image = tensor.cpu().clone() # we clone the tensor to not do changes on it
  image = image.squeeze(0) # remove the fake batch dimension
  image = unloader(image)
  plt.imshow(image)
  if title is not None:
    plt.title(title)
  plt.pause(0.001) # pause a bit so that plots are updated

5 直接保存tensor格式图片

def save_image(tensor, **para):
  dir = 'results'
  image = tensor.cpu().clone() # we clone the tensor to not do changes on it
  image = image.squeeze(0) # remove the fake batch dimension
  image = unloader(image)
  if not osp.exists(dir):
    os.makedirs(dir)
  image.save('results_{}/s{}-c{}-l{}-e{}-sl{:4f}-cl{:4f}.jpg'
        .format(num, para['style_weight'], para['content_weight'], para['lr'], para['epoch'],
            para['style_loss'], para['content_loss']))

numpy与Tensor

numpy格式是使用cv2,也就是python-opencv库读取出来的图片格式,需要注意的是用python-opencv读取出来的图片和使用PIL读取出来的图片数据略微不同,经测试用python-opencv读取出来的图片在训练时的效果比使用PIL读取出来的略差一些(详细过程之后发布)。

之后所有代码引用:

import cv2
import torch
import matplotlib.pyplot as plt

numpy转化为tensor

def toTensor(img):
  assert type(img) == np.ndarray,'the img type is {}, but ndarry expected'.format(type(img))
  img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)
  img = torch.from_numpy(img.transpose((2, 0, 1)))
  return img.float().div(255).unsqueeze(0) # 255也可以改为256

tensor转化为numpy

def tensor_to_np(tensor):
  img = tensor.mul(255).byte()
  img = img.cpu().numpy().squeeze(0).transpose((1, 2, 0))
  return img

展示numpy格式图片

def show_from_cv(img, title=None):
  img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)
  plt.figure()
  plt.imshow(img)
  if title is not None:
    plt.title(title)
  plt.pause(0.001)

展示tensor格式图片

def show_from_tensor(tensor, title=None):
  img = tensor.clone()
  img = tensor_to_np(img)
  plt.figure()
  plt.imshow(img)
  if title is not None:
    plt.title(title)
  plt.pause(0.001)

注意

上面介绍的都是一张图片的转化,如果是n张图片一起的话,只需要修改一下相应代码即可。

举个例子,将之前说过的修改略微修改一下即可:

# 将 N x H x W X C 的numpy格式图片转化为相应的tensor格式
def toTensor(img):
  img = torch.from_numpy(img.transpose((0, 3, 1, 2)))
  return img.float().div(255).unsqueeze(0)

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
详解 Python 与文件对象共事的实例
Sep 11 Python
python交互式图形编程实例(一)
Nov 17 Python
python按行读取文件,去掉每行的换行符\n的实例
Apr 19 Python
python 读取摄像头数据并保存的实例
Aug 03 Python
解决Pandas的DataFrame输出截断和省略的问题
Feb 08 Python
Python实现的删除重复文件或图片功能示例【去重】
Apr 23 Python
django 通过url实现简单的权限控制的例子
Aug 16 Python
python实现低通滤波器代码
Feb 26 Python
pycharm 激活码及使用方式的详细教程
May 12 Python
Python 如何定义匿名或内联函数
Aug 01 Python
python 字典和列表嵌套用法详解
Jun 29 Python
Python中的datetime包与time包包和模块详情
Feb 28 Python
基于h5py的使用及数据封装代码
Dec 26 #Python
python深copy和浅copy区别对比解析
Dec 26 #Python
详解python opencv、scikit-image和PIL图像处理库比较
Dec 26 #Python
torch 中各种图像格式转换的实现方法
Dec 26 #Python
python两个_多个字典合并相加的实例代码
Dec 26 #Python
Python时间差中seconds和total_seconds的区别详解
Dec 26 #Python
python requests模拟登陆github的实现方法
Dec 26 #Python
You might like
PHP中对用户身份认证实现两种方法
2011/06/04 PHP
php中require和require_once的区别说明
2014/02/27 PHP
php setcookie函数的参数说明及其用法
2014/04/20 PHP
php去除字符串中空字符的常用方法小结
2015/03/17 PHP
jQuery 全选/反选以及单击行改变背景色实例
2013/07/02 Javascript
js css后面所带参数含义介绍
2013/08/18 Javascript
浅析Cookie中的Path与domain
2013/12/18 Javascript
Window.Open如何在同一个标签页打开
2014/06/20 Javascript
JS中获取函数调用链所有参数的方法
2015/05/07 Javascript
javascript时间排序算法实现活动秒杀倒计时效果
2021/01/28 Javascript
vue.js的提示组件
2017/03/02 Javascript
vue-cli webpack 开发环境跨域详解
2017/05/18 Javascript
React实践之Tree组件的使用方法
2017/09/30 Javascript
微信小程序数据存储与取值详解
2018/01/30 Javascript
Vue项目全局配置微信分享思路详解
2018/05/04 Javascript
使用electron制作满屏心特效的示例代码
2018/11/27 Javascript
微信公众号H5之微信分享常见错误和问题(小结)
2019/11/14 Javascript
理解python多线程(python多线程简明教程)
2014/06/09 Python
Python中用于计算对数的log()方法
2015/05/15 Python
Python使用文件锁实现进程间同步功能【基于fcntl模块】
2017/10/16 Python
Tensorflow卷积神经网络实例进阶
2018/05/24 Python
Python爬虫使用代理IP的实现
2019/10/27 Python
Django 多对多字段的更新和插入数据实例
2020/03/31 Python
Pyinstaller 打包发布经验总结
2020/06/02 Python
Python 多进程、多线程效率对比
2020/11/19 Python
CSS3 transforms应用于背景图像的解决方法
2019/04/16 HTML / CSS
html5 利用canvas实现超级玛丽简单动画
2013/09/06 HTML / CSS
新西兰最大的连锁超市:Countdown
2020/06/04 全球购物
专科毕业生学习生活的自我评价
2013/10/26 职场文书
公务员培训心得体会
2013/12/28 职场文书
仓管岗位职责范本
2014/02/08 职场文书
机械专业毕业生自我鉴定2014
2014/10/04 职场文书
黄石寨导游词
2015/02/05 职场文书
Python爬取某拍短视频
2021/06/11 Python
bose降噪耳机音能消除人声吗
2022/04/19 数码科技
python绘制简单直方图(质量分布图)的方法
2022/04/21 Python