编程 Python

Python图像读写方法对比

Posted in Python onNovember 16, 2020

1 实验标准

因为训练使用的框架是Pytorch，因此读取的实验标准如下：

1、读取分辨率都为1920x1080的5张图片（png格式一张，jpg格式四张）并保存到数组。

2、将读取的数组转换为维度顺序为CxHxW的Pytorch张量，并保存到显存中（我使用GPU训练），其中三个通道的顺序为RGB。

3、记录各个方法在以上操作中所耗费的时间。因为png格式的图片大小差不多是质量有微小差异的jpg格式的10倍，所以数据集通常不会用png来保存，就不比较这两种格式的读取时间差异了。

写入的实验标准如下：

1、将5张1920x1080的5张图像对应的Pytorch张量转换为对应方法可使用的数据类型数组。

2、以jpg格式保存五张图片。

3、记录各个方法保存图片所耗费的时间。

2 实验情况

2.1 cv2

因为有GPU，所以cv2读取图片有两种方式：

1、先把图片都读取为一个numpy数组，再转换成保存在GPU中的pytorch张量。

2、初始化一个保存在GPU中的pytorch张量，然后将每张图直接复制进这个张量中。

第一种方式实验代码如下：

import os, torch
import cv2 as cv 
import numpy as np 
from time import time 
 
read_path = 'D:test'
write_path = 'D:test\\write\\'
 
# cv2读取 1
start_t = time()
imgs = np.zeros([5, 1080, 1920, 3])
for img, i in zip(os.listdir(read_path), range(5)): 
 img = cv.imread(filename=os.path.join(read_path, img))
 imgs[i] = img 
imgs = torch.tensor(imgs).to('cuda')[...,[2,1,0]].permute([0,3,1,2])/255 
print('cv2 读取时间1：', time() - start_t) 
# cv2保存
start_t = time()
imgs = (imgs.permute([0,2,3,1])[...,[2,1,0]]*255).cpu().numpy()
for i in range(imgs.shape[0]): 
 cv.imwrite(write_path + str(i) + '.jpg', imgs[i])
print('cv2 保存时间：', time() - start_t)

　实验结果：

cv2 读取时间1： 0.39693760871887207
cv2 保存时间： 0.3560612201690674

第二种方式实验代码如下：

import os, torch
import cv2 as cv 
import numpy as np 
from time import time 
 
read_path = 'D:test'
write_path = 'D:test\\write\\'
 
 
# cv2读取 2
start_t = time()
imgs = torch.zeros([5, 1080, 1920, 3], device='cuda')
for img, i in zip(os.listdir(read_path), range(5)): 
 img = torch.tensor(cv.imread(filename=os.path.join(read_path, img)), device='cuda')
 imgs[i] = img  
imgs = imgs[...,[2,1,0]].permute([0,3,1,2])/255 
print('cv2 读取时间2：', time() - start_t) 
# cv2保存
start_t = time()
imgs = (imgs.permute([0,2,3,1])[...,[2,1,0]]*255).cpu().numpy()
for i in range(imgs.shape[0]): 
 cv.imwrite(write_path + str(i) + '.jpg', imgs[i])
print('cv2 保存时间：', time() - start_t)

实验结果：

cv2 读取时间2： 0.23636841773986816
cv2 保存时间： 0.3066873550415039

2.2 matplotlib

同样两种读取方式，第一种代码如下：

import os, torch 
import numpy as np
import matplotlib.pyplot as plt 
from time import time 
 
read_path = 'D:test'
write_path = 'D:test\\write\\'
 
# matplotlib 读取 1
start_t = time()
imgs = np.zeros([5, 1080, 1920, 3])
for img, i in zip(os.listdir(read_path), range(5)): 
 img = plt.imread(os.path.join(read_path, img)) 
 imgs[i] = img  
imgs = torch.tensor(imgs).to('cuda').permute([0,3,1,2])/255 
print('matplotlib 读取时间1：', time() - start_t) 
# matplotlib 保存
start_t = time()
imgs = (imgs.permute([0,2,3,1])).cpu().numpy()
for i in range(imgs.shape[0]): 
 plt.imsave(write_path + str(i) + '.jpg', imgs[i])
print('matplotlib 保存时间：', time() - start_t)

实验结果：

matplotlib 读取时间1： 0.45380306243896484
matplotlib 保存时间： 0.768944263458252

第二种方式实验代码：

import os, torch 
import numpy as np
import matplotlib.pyplot as plt 
from time import time 
 
read_path = 'D:test'
write_path = 'D:test\\write\\'
 
# matplotlib 读取 2
start_t = time()
imgs = torch.zeros([5, 1080, 1920, 3], device='cuda')
for img, i in zip(os.listdir(read_path), range(5)): 
 img = torch.tensor(plt.imread(os.path.join(read_path, img)), device='cuda')
 imgs[i] = img  
imgs = imgs.permute([0,3,1,2])/255 
print('matplotlib 读取时间2：', time() - start_t) 
# matplotlib 保存
start_t = time()
imgs = (imgs.permute([0,2,3,1])).cpu().numpy()
for i in range(imgs.shape[0]): 
 plt.imsave(write_path + str(i) + '.jpg', imgs[i])
print('matplotlib 保存时间：', time() - start_t)

实验结果：

matplotlib 读取时间2： 0.2044532299041748
matplotlib 保存时间： 0.4737534523010254

需要注意的是，matplotlib读取png格式图片获取的数组的数值是在[0,1][0,1]范围内的浮点数，而jpg格式图片却是在[0,255][0,255]范围内的整数。所以如果数据集内图片格式不一致，要注意先转换为一致再读取，否则数据集的预处理就麻烦了。

2.3 PIL

PIL的读取与写入并不能直接使用pytorch张量或numpy数组，要先转换为Image类型，所以很麻烦，时间复杂度上肯定也是占下风的，就不实验了。

2.4 torchvision

torchvision提供了直接从pytorch张量保存图片的功能，和上面读取最快的matplotlib的方法结合，代码如下：

import os, torch 
import matplotlib.pyplot as plt 
from time import time 
from torchvision import utils 

read_path = 'D:test'
write_path = 'D:test\\write\\'
 
# matplotlib 读取 2
start_t = time()
imgs = torch.zeros([5, 1080, 1920, 3], device='cuda')
for img, i in zip(os.listdir(read_path), range(5)): 
 img = torch.tensor(plt.imread(os.path.join(read_path, img)), device='cuda')
 imgs[i] = img  
imgs = imgs.permute([0,3,1,2])/255 
print('matplotlib 读取时间2：', time() - start_t) 
# torchvision 保存
start_t = time() 
for i in range(imgs.shape[0]):  
 utils.save_image(imgs[i], write_path + str(i) + '.jpg')
print('torchvision 保存时间：', time() - start_t)

实验结果：

matplotlib 读取时间2： 0.15358829498291016
torchvision 保存时间： 0.14760661125183105

可以看出这两个是最快的读写方法。另外，要让图片的读写尽量不影响训练进程，我们还可以让这两个过程与训练并行。另外，utils.save_image可以将多张图片拼接成一张来保存，具体使用方法如下：

utils.save_image(tensor = imgs,   # 要保存的多张图片张量 shape = [n, C, H, W]
         fp = 'test.jpg',  # 保存路径
         nrow = 5,     # 多图拼接时，每行所占的图片数
         padding = 1,    # 多图拼接时，每张图之间的间距
         normalize = True, # 是否进行规范化，通常输出图像用tanh，所以要用规范化 
         range = (-1,1))  # 规范化的范围

以上就是Python图像读写方法对比的详细内容，更多关于python 图像读写的资料请关注三水点靠木其它相关文章！

Python图像读写方法对比

- Author -

颀周

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

python获取文件版本信息、公司名和产品名的方法

Oct 05 Python

用python实现面向对像的ASP程序实例

Nov 10 Python

Python中几个比较常见的名词解释

Jul 04 Python

Python 制作糗事百科爬虫实例

Sep 22 Python

Python3使用PyQt5制作简单的画板/手写板实例

Oct 19 Python

python与sqlite3实现解密chrome cookie实例代码

Jan 20 Python

Python面向对象之反射/自省机制实例分析

Aug 24 Python

对python中Librosa的mfcc步骤详解

Jan 09 Python

Django在pycharm下修改默认启动端口的方法

Jul 26 Python

Python GUI库PyQt5样式QSS子控件介绍

Feb 25 Python

基于Python实现简单学生管理系统

Jul 24 Python

python中xlutils库用法浅析

Dec 29 Python

python3中编码获取网页的实例方法

Nov 16 #Python

Python3中小括号()、中括号[]、花括号{}的区别详解

Nov 15 #Python

Python根据URL地址下载文件并保存至对应目录的实现

Nov 15 #Python

python re的findall和finditer的区别详解

Nov 15 #Python

Python获取android设备cpu和内存占用情况

Nov 15 #Python

Python __slots__的使用方法

Nov 15 #Python

Python descriptor(描述符)的实现

Nov 15 #Python

You might like

PHP has encountered an Access Violation 错误的解决方法

2010/01/17 PHP

开启CURL扩展，让服务器支持PHP curl函数(远程采集)

2011/03/19 PHP

Js sort排序使用方法

2011/10/17 Javascript

分享一个用Mootools写的鼠标滑过进度条改变进度值的实现代码

2011/12/12 Javascript

深入理解JavaScript系列(1) 编写高质量JavaScript代码的基本要点

2012/01/15 Javascript

JS限制上传图片大小不使用控件在本地实现

2012/12/19 Javascript

JS实现的生成随机数的4个函数分享

2015/02/11 Javascript

JS+DIV实现鼠标划过切换层效果的方法

2015/05/25 Javascript

JS+CSS简单树形菜单实现方法

2015/09/12 Javascript

jQuery中bind(),live(),delegate(),on()绑定事件方法实例详解

2016/01/19 Javascript

JavaScript实现的前端AES加密解密功能【基于CryptoJS】

2018/08/28 Javascript

基于Vue 服务端Cookies删除的问题

2018/09/21 Javascript

nodejs中各种加密算法的实现详解

2019/07/11 NodeJs

element-ui 中使用upload多文件上传只请求一次接口

2019/07/19 Javascript

vue中使用[provide/inject]实现页面reload的方法

2019/09/30 Javascript

vue实现桌面向网页拖动文件的示例代码(可显示图片/音频/视频)

2021/03/01 Vue.js

[34:39]DOTA2上海特级锦标赛主赛事日 - 4 败者组第四轮#1COL VS EG第二局

2016/03/05 DOTA

纯Python开发的nosql数据库CodernityDB介绍和使用实例

2014/10/23 Python

python实现带错误处理功能的远程文件读取方法

2015/04/29 Python

python多线程与多进程及其区别详解

2019/08/08 Python

使用python实现离散时间傅里叶变换的方法

2019/09/02 Python

python安装本地whl的实例步骤

2019/10/12 Python

python读取yaml文件后修改写入本地实例

2020/04/27 Python

8款使用 CSS3 实现超炫的 Loading（加载）的动画效果

2015/03/17 HTML / CSS

用HTML5 Canvas API中的clearRect()方法实现橡皮擦功能

2016/03/15 HTML / CSS

详解canvas绘制多张图的排列顺序问题

2019/01/21 HTML / CSS

美国知名男士服饰品牌：Brooks Brothers（布克兄弟）

2016/08/25 全球购物

爱耳日活动总结

2014/04/30 职场文书

总经理检讨书

2014/09/15 职场文书

2015年科协工作总结

2015/05/19 职场文书

民政局未婚证明

2015/06/15 职场文书

行政处罚告知书

2015/07/01 职场文书

晚会开幕词范文

2016/03/04 职场文书

python 模拟在天空中放风筝的示例代码

2021/04/21 Python

python实现图片九宫格分割的示例

2021/04/25 Python

Redis实战之Lettuce的使用技巧详解

2022/12/24 Redis