基于Python的图像数据增强Data Augmentation解析


Posted in Python onAugust 13, 2019

1.1 简介

深层神经网络一般都需要大量的训练数据才能获得比较理想的结果。在数据量有限的情况下,可以通过数据增强(Data Augmentation)来增加训练样本的多样性, 提高模型鲁棒性,避免过拟合。

在计算机视觉中,典型的数据增强方法有翻转(Flip),旋转(Rotat ),缩放(Scale),随机裁剪或补零(Random Crop or Pad),色彩抖动(Color jittering),加噪声(Noise)

笔者在跟进视频及图像中的人体姿态检测和关键点追踪(Human Pose Estimatiion and Tracking in videos)的项目。因此本文的数据增强仅使用——翻转(Flip),旋转(Rotate ),缩放以及缩放(Scale)

2.1 裁剪(Crop)

  • image.shape--([3, width, height])一个视频序列中的一帧图片,裁剪前大小不统一
  • bbox.shape--([4,])人体检测框,用于裁剪
  • x.shape--([1,13]) 人体13个关键点的所有x坐标值
  • y.shape--([1,13])人体13个关键点的所有y坐标值
def crop(image, bbox, x, y, length):
    x, y, bbox = x.astype(np.int), y.astype(np.int), bbox.astype(np.int)

    x_min, y_min, x_max, y_max = bbox
    w, h = x_max - x_min, y_max - y_min

    # Crop image to bbox
    image = image[y_min:y_min + h, x_min:x_min + w, :]

    # Crop joints and bbox
    x -= x_min
    y -= y_min
    bbox = np.array([0, 0, x_max - x_min, y_max - y_min])

    # Scale to desired size
    side_length = max(w, h)
    f_xy = float(length) / float(side_length)
    image, bbox, x, y = Transformer.scale(image, bbox, x, y, f_xy)

    # Pad
    new_w, new_h = image.shape[1], image.shape[0]
    cropped = np.zeros((length, length, image.shape[2]))

    dx = length - new_w
    dy = length - new_h
    x_min, y_min = int(dx / 2.), int(dy / 2.)
    x_max, y_max = x_min + new_w, y_min + new_h

    cropped[y_min:y_max, x_min:x_max, :] = image
    x += x_min
    y += y_min

    x = np.clip(x, x_min, x_max)
    y = np.clip(y, y_min, y_max)

    bbox += np.array([x_min, y_min, x_min, y_min])
    return cropped, bbox, x.astype(np.int), y.astype(np.int)

2.2 缩放(Scale)

  • image.shape--([3, 256, 256])一个视频序列中的一帧图片,裁剪后输入网络为256*256
  • bbox.shape--([4,])人体检测框,用于裁剪
  • x.shape--([1,13]) 人体13个关键点的所有x坐标值
  • y.shape--([1,13])人体13个关键点的所有y坐标值
  • f_xy--缩放倍数
def scale(image, bbox, x, y, f_xy):
    (h, w, _) = image.shape
    h, w = int(h * f_xy), int(w * f_xy)
    image = resize(image, (h, w), preserve_range=True, anti_aliasing=True, mode='constant').astype(np.uint8)

    x = x * f_xy
    y = y * f_xy
    bbox = bbox * f_xy

    x = np.clip(x, 0, w)
    y = np.clip(y, 0, h)

    return image, bbox, x, y

2.3 翻转(fillip)

这里是将图片围绕对称轴进行左右翻转(因为人体是左右对称的,在关键点检测中有助于防止模型过拟合)

def flip(image, bbox, x, y):
    image = np.fliplr(image).copy()
    w = image.shape[1]
    x_min, y_min, x_max, y_max = bbox
    bbox = np.array([w - x_max, y_min, w - x_min, y_max])
    x = w - x
    x, y = Transformer.swap_joints(x, y)
    return image, bbox, x, y

翻转前:

基于Python的图像数据增强Data Augmentation解析

翻转后:

基于Python的图像数据增强Data Augmentation解析

2.4 旋转(rotate)

angle--旋转角度

def rotate(image, bbox, x, y, angle):
    # image - -(256, 256, 3)
    # bbox - -(4,)
    # x - -[126 129 124 117 107 99 128 107 108 105 137 155 122 99]
    # y - -[209 176 136 123 178 225 65 47 46 24 44 64 49 54]
    # angle - --8.165648811999333
    # center of image [128,128]
    o_x, o_y = (np.array(image.shape[:2][::-1]) - 1) / 2.
    width,height = image.shape[0],image.shape[1]
    x1 = x
    y1 = height - y
    o_x = o_x
    o_y = height - o_y
    image = rotate(image, angle, preserve_range=True).astype(np.uint8)
    r_x, r_y = o_x, o_y
    angle_rad = (np.pi * angle) /180.0
    x = r_x + np.cos(angle_rad) * (x1 - o_x) - np.sin(angle_rad) * (y1 - o_y)
    y = r_y + np.sin(angle_rad) * (x1 - o_x) + np.cos(angle_rad) * (y1 - o_y)
    x = x
    y = height - y
    bbox[0] = r_x + np.cos(angle_rad) * (bbox[0] - o_x) + np.sin(angle_rad) * (bbox[1] - o_y)
    bbox[1] = r_y + -np.sin(angle_rad) * (bbox[0] - o_x) + np.cos(angle_rad) * (bbox[1] - o_y)
    bbox[2] = r_x + np.cos(angle_rad) * (bbox[2] - o_x) + np.sin(angle_rad) * (bbox[3] - o_y)
    bbox[3] = r_y + -np.sin(angle_rad) * (bbox[2] - o_x) + np.cos(angle_rad) * (bbox[3] - o_y)
    return image, bbox, x.astype(np.int), y.astype(np.int)

旋转前:

基于Python的图像数据增强Data Augmentation解析

旋转后:

基于Python的图像数据增强Data Augmentation解析

3 结果(output)

数据增强前的原图:

基于Python的图像数据增强Data Augmentation解析

数据增强后:

基于Python的图像数据增强Data Augmentation解析

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python中使用Flask、MongoDB搭建简易图片服务器
Feb 04 Python
简单介绍使用Python解析并修改XML文档的方法
Oct 15 Python
详谈Numpy中数组重塑、合并与拆分方法
Apr 17 Python
python使用openpyxl库修改excel表格数据方法
May 03 Python
解决python写入带有中文的字符到文件错误的问题
Jan 31 Python
利用Python进行图像的加法,图像混合(附代码)
Jul 14 Python
python的命名规则知识点总结
Oct 04 Python
opencv3/C++实现视频背景去除建模(BSM)
Dec 11 Python
python安装sklearn模块的方法详解
Nov 28 Python
Python字符串对齐、删除字符串不需要的内容以及格式化打印字符
Jan 23 Python
python反扒机制的5种解决方法
Feb 06 Python
Python基本的内置数据类型及使用方法
Apr 13 Python
python通过txt文件批量安装依赖包的实现步骤
Aug 13 #Python
Python Multiprocessing多进程 使用tqdm显示进度条的实现
Aug 13 #Python
python如何将多个PDF进行合并
Aug 13 #Python
python批量读取文件名并写入txt文件中
Sep 05 #Python
Flask框架实现的前端RSA加密与后端Python解密功能详解
Aug 13 #Python
Python学习笔记之列表推导式实例分析
Aug 13 #Python
Django中create和save方法的不同
Aug 13 #Python
You might like
PHP中str_replace函数使用小结
2008/10/11 PHP
PHP用mysql数据库存储session的代码
2010/03/05 PHP
ThinkPHP中ajax使用实例教程
2014/08/22 PHP
php打包压缩文件之ZipArchive方法用法分析
2016/04/30 PHP
php获取当前月与上个月月初及月末时间戳的方法
2016/12/05 PHP
javascript之解决IE下不渲染的bug
2007/06/29 Javascript
JavaScript 变量基础知识
2009/11/07 Javascript
javascript css styleFloat和cssFloat
2010/03/15 Javascript
jQuery学习笔记 获取jQuery对象
2012/09/19 Javascript
js获取当前页面路径示例讲解
2014/01/08 Javascript
js跨域请求数据的3种常用的方法
2015/12/01 Javascript
7个去伪存真的JavaScript面试题
2016/01/07 Javascript
jQuery Mobile漏洞会有跨站脚本攻击风险
2017/02/12 Javascript
详解angular2实现ng2-router 路由和嵌套路由
2017/03/24 Javascript
js 获取json数组里面数组的长度实例
2017/10/31 Javascript
基于Bootstrap实现城市三级联动
2017/11/23 Javascript
基于jQuery Ajax实现下拉框无刷新联动
2017/12/06 jQuery
jquery分页优化操作实例分析
2019/08/23 jQuery
vue addRoutes路由动态加载操作
2020/08/04 Javascript
vue-router重写push方法,解决相同路径跳转报错问题
2020/08/07 Javascript
一篇超完整的Vue新手入门指导教程
2020/11/18 Vue.js
Python的Flask框架中实现登录用户的个人资料和头像的教程
2015/04/20 Python
Python删除空文件和空文件夹的方法
2015/07/14 Python
微信跳一跳小游戏python脚本
2018/01/05 Python
Python使用wxPython实现计算器
2018/01/30 Python
python traceback捕获并打印异常的方法
2018/08/31 Python
Python定时任务随机时间执行的实现方法
2019/08/14 Python
PyTorch中常用的激活函数的方法示例
2019/08/20 Python
Python类和实例的属性机制原理详解
2020/03/21 Python
浅谈Python 钉钉报警必备知识系统讲解
2020/08/17 Python
Python+OpenCV图像处理——打印图片属性、设置存储路径、调用摄像头
2020/10/22 Python
学生会竞选演讲稿
2014/04/24 职场文书
2014乡镇班子个人对照检查材料思想汇报
2014/09/26 职场文书
2014法制宣传日活动总结范文
2014/11/01 职场文书
工作迟到检讨书范文
2015/05/06 职场文书
Pandas搭配lambda组合使用详解
2022/01/22 Python