Pytorch中Tensor与各种图像格式的相互转化详解


Posted in Python onDecember 26, 2019

前言

在pytorch中经常会遇到图像格式的转化,例如将PIL库读取出来的图片转化为Tensor,亦或者将Tensor转化为numpy格式的图片。而且使用不同图像处理库读取出来的图片格式也不相同,因此,如何在pytorch中正确转化各种图片格式(PIL、numpy、Tensor)是一个在调试中比较重要的问题。

本文主要说明在pytorch中如何正确将图片格式在各种图像库读取格式以及tensor向量之间转化的问题。以下代码经过测试都可以在Pytorch-0.4.0或0.3.0版本直接使用。

对python不同的图像库读取格式有疑问可以看这里:https://3water.com/article/177288.htm

格式转换

我们一般在pytorch或者python中处理的图像无非这几种格式:

  • PIL:使用python自带图像处理库读取出来的图片格式
  • numpy:使用python-opencv库读取出来的图片格式
  • tensor:pytorch中训练时所采取的向量格式(当然也可以说图片)

注意,之后的讲解图片格式皆为RGB三通道,24-bit真彩色,也就是我们平常使用的图片形式。

PIL与Tensor

PIL与Tensor的转换相对容易些,因为pytorch已经提供了相关的代码,我们只需要搭配使用即可:

所有代码都已经引用了(之后的代码省略引用部分):

import torch
from PIL import Image
import matplotlib.pyplot as plt

# loader使用torchvision中自带的transforms函数
loader = transforms.Compose([
  transforms.ToTensor()]) 

unloader = transforms.ToPILImage()

1 PIL读取图片转化为Tensor

# 输入图片地址
# 返回tensor变量
def image_loader(image_name):
  image = Image.open(image_name).convert('RGB')
  image = loader(image).unsqueeze(0)
  return image.to(device, torch.float)

2 将PIL图片转化为Tensor

# 输入PIL格式图片
# 返回tensor变量
def PIL_to_tensor(image):
  image = loader(image).unsqueeze(0)
  return image.to(device, torch.float)

3 Tensor转化为PIL图片

# 输入tensor变量
# 输出PIL格式图片
def tensor_to_PIL(tensor):
  image = tensor.cpu().clone()
  image = image.squeeze(0)
  image = unloader(image)
  return image

4 直接展示tensor格式图片

def imshow(tensor, title=None):
  image = tensor.cpu().clone() # we clone the tensor to not do changes on it
  image = image.squeeze(0) # remove the fake batch dimension
  image = unloader(image)
  plt.imshow(image)
  if title is not None:
    plt.title(title)
  plt.pause(0.001) # pause a bit so that plots are updated

5 直接保存tensor格式图片

def save_image(tensor, **para):
  dir = 'results'
  image = tensor.cpu().clone() # we clone the tensor to not do changes on it
  image = image.squeeze(0) # remove the fake batch dimension
  image = unloader(image)
  if not osp.exists(dir):
    os.makedirs(dir)
  image.save('results_{}/s{}-c{}-l{}-e{}-sl{:4f}-cl{:4f}.jpg'
        .format(num, para['style_weight'], para['content_weight'], para['lr'], para['epoch'],
            para['style_loss'], para['content_loss']))

numpy与Tensor

numpy格式是使用cv2,也就是python-opencv库读取出来的图片格式,需要注意的是用python-opencv读取出来的图片和使用PIL读取出来的图片数据略微不同,经测试用python-opencv读取出来的图片在训练时的效果比使用PIL读取出来的略差一些(详细过程之后发布)。

之后所有代码引用:

import cv2
import torch
import matplotlib.pyplot as plt

numpy转化为tensor

def toTensor(img):
  assert type(img) == np.ndarray,'the img type is {}, but ndarry expected'.format(type(img))
  img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)
  img = torch.from_numpy(img.transpose((2, 0, 1)))
  return img.float().div(255).unsqueeze(0) # 255也可以改为256

tensor转化为numpy

def tensor_to_np(tensor):
  img = tensor.mul(255).byte()
  img = img.cpu().numpy().squeeze(0).transpose((1, 2, 0))
  return img

展示numpy格式图片

def show_from_cv(img, title=None):
  img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)
  plt.figure()
  plt.imshow(img)
  if title is not None:
    plt.title(title)
  plt.pause(0.001)

展示tensor格式图片

def show_from_tensor(tensor, title=None):
  img = tensor.clone()
  img = tensor_to_np(img)
  plt.figure()
  plt.imshow(img)
  if title is not None:
    plt.title(title)
  plt.pause(0.001)

注意

上面介绍的都是一张图片的转化,如果是n张图片一起的话,只需要修改一下相应代码即可。

举个例子,将之前说过的修改略微修改一下即可:

# 将 N x H x W X C 的numpy格式图片转化为相应的tensor格式
def toTensor(img):
  img = torch.from_numpy(img.transpose((0, 3, 1, 2)))
  return img.float().div(255).unsqueeze(0)

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python使用poplib模块和smtplib模块收发电子邮件的教程
Jul 02 Python
windows及linux环境下永久修改pip镜像源的方法
Nov 28 Python
利用Python脚本生成sitemap.xml的实现方法
Jan 31 Python
Python基于回溯法子集树模板解决选排问题示例
Sep 07 Python
Python实现的连接mssql数据库操作示例
Aug 17 Python
Python标准库使用OrderedDict类的实例讲解
Feb 14 Python
python+openCV利用摄像头实现人员活动检测
Jun 22 Python
用python打印1~20的整数实例讲解
Jul 01 Python
使用Python实现文字转语音并生成wav文件的例子
Aug 08 Python
Numpy对数组的操作:创建、变形(升降维等)、计算、取值、复制、分割、合并
Aug 28 Python
利用Tensorflow构建和训练自己的CNN来做简单的验证码识别方式
Jan 20 Python
如何表示python中的相对路径
Jul 08 Python
基于h5py的使用及数据封装代码
Dec 26 #Python
python深copy和浅copy区别对比解析
Dec 26 #Python
详解python opencv、scikit-image和PIL图像处理库比较
Dec 26 #Python
torch 中各种图像格式转换的实现方法
Dec 26 #Python
python两个_多个字典合并相加的实例代码
Dec 26 #Python
Python时间差中seconds和total_seconds的区别详解
Dec 26 #Python
python requests模拟登陆github的实现方法
Dec 26 #Python
You might like
php mssql 分页SQL语句优化 持续影响
2009/04/26 PHP
php递归实现无限分类的方法
2015/07/28 PHP
php检查页面是否被百度收录
2015/10/28 PHP
javascript编程起步(第二课)
2007/01/10 Javascript
js解析xml字符串和xml文档实现原理及代码(针对ie与火狐)
2013/02/02 Javascript
jquery scrollTop方法根据滚动像素显示隐藏顶部导航条
2013/05/27 Javascript
jquery如何根据值设置默认的选中项
2014/03/17 Javascript
jQuery前端框架easyui使用Dialog时bug处理
2014/12/05 Javascript
14个有用的Jquery技巧分享
2015/01/08 Javascript
Node.js巧妙实现Web应用代码热更新
2015/10/22 Javascript
javascript实现label标签跳出循环操作
2016/03/06 Javascript
js添加千分位的实现代码(超简单)
2016/08/01 Javascript
详解Nodejs的timers模块
2016/12/22 NodeJs
详解如何在react中搭建d3力导向图
2018/01/12 Javascript
vue搜索和vue模糊搜索代码实例
2019/05/07 Javascript
js 判断当前时间是否处于某个一个时间段内
2019/09/19 Javascript
微信小程序实现Swiper轮播图效果
2019/11/22 Javascript
JS 逻辑判断不要只知道用 if-else 和 switch条件判断(小技巧)
2020/05/27 Javascript
基于Django filter中用contains和icontains的区别(详解)
2017/12/12 Python
Python之time模块的时间戳,时间字符串格式化与转换方法(13位时间戳)
2019/08/12 Python
Python 基于wxpy库实现微信添加好友功能(简洁)
2019/11/29 Python
python:HDF和CSV存储优劣对比分析
2020/06/08 Python
Python数据相关系数矩阵和热力图轻松实现教程
2020/06/16 Python
一款利用html5和css3实现的3D立方体旋转效果教程
2016/04/26 HTML / CSS
wedgwood加拿大官网:1759年成立的英国国宝级陶瓷餐具品牌
2018/07/17 全球购物
说出你对remoting 和webservice的理解和应用
2014/06/08 面试题
高校生生产实习自我鉴定
2013/09/21 职场文书
大专计算机个人求职的自我评价
2013/10/21 职场文书
资产经营总监岗位职责
2013/12/04 职场文书
车辆安全检查制度
2014/01/12 职场文书
初中三好学生自我鉴定
2014/04/07 职场文书
入党积极分子学习优秀共产党员先进事迹思想汇报
2014/09/13 职场文书
电视新闻稿
2015/07/17 职场文书
宣传稿格式范文
2015/07/23 职场文书
致创业您:正能量激励人心句子(48条)
2019/08/15 职场文书
MySQL示例讲解数据库约束以及表的设计
2022/06/16 MySQL