编程 Python

Keras 在fit_generator训练方式中加入图像random_crop操作

Posted in Python onJuly 03, 2020

使用Keras作前端写网络时，由于训练图像尺寸较大，需要做类似 tf.random_crop 图像裁剪操作。

为此研究了一番Keras下已封装的API。

Data Augmentation（数据扩充）

Data Aumentation 指使用下面或其他方法增加输入数据量。我们默认图像数据。

旋转&反射变换(Rotation/reflection): 随机旋转图像一定角度; 改变图像内容的朝向;

翻转变换(flip): 沿着水平或者垂直方向翻转图像;

缩放变换(zoom): 按照一定的比例放大或者缩小图像;

平移变换(shift): 在图像平面上对图像以一定方式进行平移;

可以采用随机或人为定义的方式指定平移范围和平移步长, 沿水平或竖直方向进行平移. 改变图像内容的位置;

尺度变换(scale): 对图像按照指定的尺度因子, 进行放大或缩小; 或者参照SIFT特征提取思想, 利用指定的尺度因子对图像滤波构造尺度空间. 改变图像内容的大小或模糊程度;

对比度变换(contrast): 在图像的HSV颜色空间，改变饱和度S和V亮度分量，保持色调H不变. 对每个像素的S和V分量进行指数运算(指数因子在0.25到4之间), 增加光照变化;

噪声扰动(noise): 对图像的每个像素RGB进行随机扰动, 常用的噪声模式是椒盐噪声和高斯噪声;

Data Aumentation 有很多好处，比如数据量较少时，用数据扩充来增加训练数据，防止过拟合。

ImageDataGenerator

在Keras中，ImageDataGenerator就是专门做数据扩充的。

from keras.preprocessing.image import ImageDataGenerator

注：Using TensorFlow backend.

官方写法如下：

(x_train, y_train), (x_test, y_test) = cifar10.load_data()

datagen = ImageDataGenerator(
 featurewise_center=True,
 ...
 horizontal_flip=True)

# compute quantities required for featurewise normalization
datagen.fit(x_train)

# 使用fit_generator的【自动】训练方法: fits the model on batches with real-time data augmentation
model.fit_generator(datagen.flow(x_train, y_train, batch_size=32),
   steps_per_epoch=len(x_train), epochs=epochs)

# 自己写range循环的【手动】训练方法
for e in range(epochs):
 print 'Epoch', e
 batches = 0
 for x_batch, y_batch in datagen.flow(x_train, y_train, batch_size=32):
 loss = model.train(x_batch, y_batch)
 batches += 1
 if batches >= len(x_train) / 32:
  # we need to break the loop by hand because
  # the generator loops indefinitely
  break

ImageDataGenerator的参数说明见官网文档。

上面两种训练方法的差异不讨论，我们要关注的是：官方封装的训练集batch生成器是ImageDataGenerator对象的flow方法(或flow_from_directory)，该函数返回一个和python定义相似的generator。在它前一步，数据变换是ImageDataGenerator对象的fit方法。

random_crop并未在ImageDataGenerator中内置，但参数中给了一个preprocessing_function，我们可以利用它自定义my_random_crop函数，像下面这样写：

def my_random_crop(image):
 random_arr = numpy.random.randint(img_sz-crop_sz+1, size=2)
 y = int(random_arr[0])
 x = int(random_arr[1])
 h = img_crop
 w = img_crop
 image_crop = image[y:y+h, x:x+w, :]
 return image_crop

datagen = ImageDataGenerator(
 featurewise_center=False,
 ···
 preprocessing_function=my_random_crop)

datagen.fit(x_train)

fit方法调用时将预设的变换应用到x_train的每张图上，包括图像crop，因为是单张依次处理，每张图的crop位置随机。

在训练数据(x=image, y=class_label)时这样写已满足要求;

但在(x=image, y=image_mask)时该方法就不成立了。图像单张处理的缘故，一对(image, image_mask)分别crop的位置无法保持一致。

虽然官网也给出了同时变换image和mask的写法，但它提出的方案能保证二者内置函数的变换一致，自定义函数的random变量仍是随机的。

fit_generator

既然ImageDataGenerator和flow方法不能满足我们的random_crop预处理要求，就在fit_generator函数处想方法修改。

先看它的定义：

def fit_generator(self, generator, samples_per_epoch, nb_epoch,
   verbose=1, callbacks=[],
   validation_data=None, nb_val_samples=None,
   class_weight=None, max_q_size=10, **kwargs):

第一个参数generator，可以传入一个方法，也可以直接传入数据集。前面的 datagen.flow() 即是Keras封装的批量数据传入方法。

显然，我们可以自定义。

def generate_batch_data_random(x, y, batch_size):
 """分批取batch数据加载到显存"""
 total_num = len(x)
 batches = total_num // batch_size
 while (True):
 i = randint(0, batches)
 x_batch = x[i*batch_size:(i+1)*batch_size]
 y_batch = y[i*batch_size:(i+1)*batch_size]
 random_arr = numpy.random.randint(img_sz-crop_sz+1, size=2)
 y_pos = int(random_arr[0])
 x_pos = int(random_arr[1])
 x_crop = x_batch[:, y_pos:y_pos+crop_sz, x_pos:x_pos+crop_sz, :]
 y_crop = y_batch[:, y_pos:y_pos+crop_sz, x_pos:x_pos+crop_sz, :]
 yield (x_crop, y_crop)

这样写就符合我们同组image和mask位置一致的random_crop要求。

注意：

由于没有使用ImageDataGenerator内置的数据变换方法，数据扩充则也需要自定义；由于没有使用flow(…, shuffle=True,)方法，每个epoch的数据打乱需要自定义。

generator自定义时要写成死循环，因为在每个epoch内，generate_batch_data_random是不会重复调用的。

补充知识：tensorflow中的随机裁剪函数random_crop

tf.random_crop是tensorflow中的随机裁剪函数，可以用来裁剪图片。我采用如下图片进行随机裁剪，裁剪大小为原图的一半。

Keras 在fit_generator训练方式中加入图像random_crop操作

如下是实验代码

import tensorflow as tf
import matplotlib.image as img
import matplotlib.pyplot as plt
sess = tf.InteractiveSession()
image = img.imread('D:/Documents/Pictures/logo3.jpg')

reshaped_image = tf.cast(image,tf.float32)
size = tf.cast(tf.shape(reshaped_image).eval(),tf.int32)
height = sess.run(size[0]//2)
width = sess.run(size[1]//2)
distorted_image = tf.random_crop(reshaped_image,[height,width,3])
print(tf.shape(reshaped_image).eval())
print(tf.shape(distorted_image).eval())

fig = plt.figure()
fig1 = plt.figure()
ax = fig.add_subplot(111)
ax1 = fig1.add_subplot(111)
ax.imshow(sess.run(tf.cast(reshaped_image,tf.uint8)))
ax1.imshow(sess.run(tf.cast(distorted_image,tf.uint8)))
plt.show()

如下是随机实验两次的结果

Keras 在fit_generator训练方式中加入图像random_crop操作

以上这篇Keras 在fit_generator训练方式中加入图像random_crop操作就是小编分享给大家的全部内容了，希望能给大家一个参考，也希望大家多多支持三水点靠木。

Keras 在fit_generator训练方式中加入图像random_crop操作

- Author -

Joy_Shen

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

python实现实时监控文件的方法

Aug 26 Python

django实现同一个ip十分钟内只能注册一次的实例

Nov 03 Python

把pandas转换int型为str型的方法

Jan 29 Python

Django自定义用户登录认证示例代码

Jun 30 Python

python交易记录链的实现过程详解

Jul 03 Python

利用python-pypcap抓取带VLAN标签的数据包方法

Jul 23 Python

Python3显示当前时间、计算时间差及时间加减法示例代码

Sep 07 Python

Python多线程爬取豆瓣影评API接口

Oct 22 Python

PIL包中Image模块的convert()函数的具体使用

Feb 26 Python

Python如何爬取51cto数据并存入MySQL

Aug 25 Python

基于Python组装jmx并调用JMeter实现压力测试

Nov 03 Python

pytorch实现线性回归以及多元回归

Apr 11 Python

keras的三种模型实现与区别说明

Jul 03 #Python

Keras中 ImageDataGenerator函数的参数用法

Jul 03 #Python

python程序如何进行保存

Jul 03 #Python

keras的ImageDataGenerator和flow()的用法说明

Jul 03 #Python

python如何安装下载后的模块

Jul 03 #Python

python中id函数运行方式

Jul 03 #Python

Keras 数据增强ImageDataGenerator多输入多输出实例

Jul 03 #Python

You might like

codeigniter中view通过循环显示数组数据的方法

2015/03/20 PHP

thinkphp3.x连接mysql数据库的方法(具体操作步骤)

2016/05/19 PHP

Windows平台实现PHP连接SQL Server2008的方法

2017/07/26 PHP

PHP实现通过二维数组键值获取一维键名操作示例

2019/10/11 PHP

Thinkphp 框架扩展之驱动扩展实例分析

2020/04/27 PHP

JQuery实现的在新窗口打开链接的方法小结

2010/04/22 Javascript

Ext.get() 和 Ext.query()组合使用实现最灵活的取元素方式

2011/09/26 Javascript

超级好用的jQuery圆角插件 Corner速成

2014/08/31 Javascript

js中不同的height, top的区别对比

2015/09/24 Javascript

JS简单封装的图片无缝滚动效果示例【测试可用】

2017/03/22 Javascript

vue.js加载新的内容(实例代码)

2017/06/01 Javascript

详解如何让InstantClick兼容MathJax、百度统计等

2017/09/12 Javascript

centos 上快速搭建ghost博客方法分享

2018/05/23 Javascript

vue移动端实现红包雨效果

2020/06/23 Javascript

React Component存在的几种形式详解

2018/11/06 Javascript

基于Vue实现微前端的示例代码

2020/04/24 Javascript

[01:39:04]DOTA2-DPC中国联赛正赛 SAG vs CDEC BO3 第二场 2月1日

2021/03/11 DOTA

python字符串替换的2种方法

2014/11/30 Python

在Python中使用HTMLParser解析HTML的教程

2015/04/29 Python

Python开发的十个小贴士和技巧及长常犯错误

2018/09/27 Python

Python字符串的全排列算法实例详解

2019/01/07 Python

python基础梳理（一）（推荐）

2019/04/06 Python

Python自定义函数计算给定日期是该年第几天的方法示例

2019/05/30 Python

django将网络中的图片,保存成model中的ImageField的实例

2019/08/07 Python

Python运行异常管理解决方案

2020/03/09 Python

基于python实现MQTT发布订阅过程原理解析

2020/07/27 Python

python解包概念及实例

2021/02/17 Python

前端使用canvas生成盲水印的加密解密的实现

2020/12/16 HTML / CSS

公司培训欢迎词

2014/01/10 职场文书

金融管理毕业生求职信

2014/03/03 职场文书

员工入职担保书范文

2014/04/01 职场文书

合作意向书

2014/07/30 职场文书

2014年学习委员工作总结

2014/11/14 职场文书

你有一份《诚信考试承诺书》待领取

2019/11/13 职场文书

万能密码的SQL注入漏洞其PHP环境搭建及防御手段

2021/09/04 SQL Server

从原生JavaScript到React深入理解

2022/07/23 Javascript