将labelme格式数据转化为标准的coco数据集格式方式


Posted in Python onFebruary 17, 2020

labelme标注图像生成的json格式:

{
 "version": "3.11.2",
 "flags": {},
 "shapes": [# 每个对象的形状
 { # 第一个对象
  "label": "malignant",
  "line_color": null,
  "fill_color": null,
  "points": [# 边缘是由点构成,将这些点连在一起就是对象的边缘多边形
  [
   371, # 第一个点 x 坐标
   257 # 第一个点 y 坐标
  ],
  ...
  [
   412,
   255
  ]
  ],
  "shape_type": "polygon" # 形状类型:多边形
 },
 {
  "label": "malignant", # 第一个对象的标签
  "line_color": null,
  "fill_color": null,
  "points": [# 第二个对象
  [
   522,
   274
  ],
  ...
  [
   561,
   303
  ]
  ],
  "shape_type": "polygon"
 },
 {
  "label": "malignant", # 第二个对象的标签
  "line_color": null,
  "fill_color": null,
 "imagePath": "../../val2017/000001.jpg", # 原始图片的路径
 "imageData":"something too long ",# 原图像数据 通过该字段可以解析出原图像数据
 "imageHeight": 768,
 "imageWidth": 1024
}

coco标准数据集格式:

COCO通过大量使用Amazon Mechanical Turk来收集数据。COCO数据集现在有3种标注类型:object instances(目标实例), object keypoints(目标上的关键点), and image captions(看图说话),使用JSON文件存储。

基本的JSON结构体类型

这3种类型共享下面所列的基本类型,包括image、categories、annotation类型。

Images类型:

"images": [
  {
   "height": 768,
   "width": 1024,
   "id": 1, #图片id
   "file_name": "000002.jpg"
  }
]

categories类型:

"categories": [
  {
   "supercategory": "Cancer", #父类
   "id": 1,   #标签类别id,0表示背景
   "name": "benign" #子类
  },
  {
   "supercategory": "Cancer",
   "id": 2,
   "name": "malignant"
  }
 ],

annotations类型:

"annotations": [
  {
   "segmentation": [#坐标点的坐标值
    [
     418,
     256,
     391,
     293,
     406,
     323,
     432,
     340,
     452,
     329,
     458,
     311,
     458,
     286,
     455,
     277,
     439,
     264,
     418,
     293,
     391,
     256
    ]
   ],
   "iscrowd": 0, #单个的对象(iscrowd=0)可能需要多个polygon来表示
   "image_id": 1, #和image的id保持一致
   "bbox": [  #标注的边框值 bbox是将segmentation包起来的水平矩形
    391.0,
    256.0,
    67.0,
    84.0
   ],
   "area": 5628.0, #标注的边框面积
   "category_id": 1, #所属类别id
   "id": 1   #标注边框的id : 1,2,3...,n
  }
]

labelme 转化为coco

# -*- coding:utf-8 -*-
# !/usr/bin/env python
 
import argparse
import json
import matplotlib.pyplot as plt
import skimage.io as io
import cv2
from labelme import utils
import numpy as np
import glob
import PIL.Image
 
class MyEncoder(json.JSONEncoder):
 def default(self, obj):
  if isinstance(obj, np.integer):
   return int(obj)
  elif isinstance(obj, np.floating):
   return float(obj)
  elif isinstance(obj, np.ndarray):
   return obj.tolist()
  else:
   return super(MyEncoder, self).default(obj)
 
class labelme2coco(object):
 def __init__(self, labelme_json=[], save_json_path='./tran.json'):
  '''
  :param labelme_json: 所有labelme的json文件路径组成的列表
  :param save_json_path: json保存位置
  '''
  self.labelme_json = labelme_json
  self.save_json_path = save_json_path
  self.images = []
  self.categories = []
  self.annotations = []
  # self.data_coco = {}
  self.label = []
  self.annID = 1
  self.height = 0
  self.width = 0
 
  self.save_json()
 
 def data_transfer(self):
 
  for num, json_file in enumerate(self.labelme_json):
   with open(json_file, 'r') as fp:
    data = json.load(fp) # 加载json文件
    self.images.append(self.image(data, num))
    for shapes in data['shapes']:
     label = shapes['label']
     if label not in self.label:
      self.categories.append(self.categorie(label))
      self.label.append(label)
     points = shapes['points']#这里的point是用rectangle标注得到的,只有两个点,需要转成四个点
     #points.append([points[0][0],points[1][1]])
     #points.append([points[1][0],points[0][1]])
     self.annotations.append(self.annotation(points, label, num))
     self.annID += 1
 
 def image(self, data, num):
  image = {}
  img = utils.img_b64_to_arr(data['imageData']) # 解析原图片数据
  # img=io.imread(data['imagePath']) # 通过图片路径打开图片
  # img = cv2.imread(data['imagePath'], 0)
  height, width = img.shape[:2]
  img = None
  image['height'] = height
  image['width'] = width
  image['id'] = num + 1
  #image['file_name'] = data['imagePath'].split('/')[-1]
  image['file_name'] = data['imagePath'][3:14]
  self.height = height
  self.width = width
 
  return image
 
 def categorie(self, label):
  categorie = {}
  categorie['supercategory'] = 'Cancer'
  categorie['id'] = len(self.label) + 1 # 0 默认为背景
  categorie['name'] = label
  return categorie
 
 def annotation(self, points, label, num):
  annotation = {}
  annotation['segmentation'] = [list(np.asarray(points).flatten())]
  annotation['iscrowd'] = 0
  annotation['image_id'] = num + 1
  # annotation['bbox'] = str(self.getbbox(points)) # 使用list保存json文件时报错(不知道为什么)
  # list(map(int,a[1:-1].split(','))) a=annotation['bbox'] 使用该方式转成list
  annotation['bbox'] = list(map(float, self.getbbox(points)))
  annotation['area'] = annotation['bbox'][2] * annotation['bbox'][3]
  # annotation['category_id'] = self.getcatid(label)
  annotation['category_id'] = self.getcatid(label)#注意,源代码默认为1
  annotation['id'] = self.annID
  return annotation
 
 def getcatid(self, label):
  for categorie in self.categories:
   if label == categorie['name']:
    return categorie['id']
  return 1
 
 def getbbox(self, points):
  # img = np.zeros([self.height,self.width],np.uint8)
  # cv2.polylines(img, [np.asarray(points)], True, 1, lineType=cv2.LINE_AA) # 画边界线
  # cv2.fillPoly(img, [np.asarray(points)], 1) # 画多边形 内部像素值为1
  polygons = points
 
  mask = self.polygons_to_mask([self.height, self.width], polygons)
  return self.mask2box(mask)
 
 def mask2box(self, mask):
  '''从mask反算出其边框
  mask:[h,w] 0、1组成的图片
  1对应对象,只需计算1对应的行列号(左上角行列号,右下角行列号,就可以算出其边框)
  '''
  # np.where(mask==1)
  index = np.argwhere(mask == 1)
  rows = index[:, 0]
  clos = index[:, 1]
  # 解析左上角行列号
  left_top_r = np.min(rows) # y
  left_top_c = np.min(clos) # x
 
  # 解析右下角行列号
  right_bottom_r = np.max(rows)
  right_bottom_c = np.max(clos)
 
  # return [(left_top_r,left_top_c),(right_bottom_r,right_bottom_c)]
  # return [(left_top_c, left_top_r), (right_bottom_c, right_bottom_r)]
  # return [left_top_c, left_top_r, right_bottom_c, right_bottom_r] # [x1,y1,x2,y2]
  return [left_top_c, left_top_r, right_bottom_c - left_top_c,
    right_bottom_r - left_top_r] # [x1,y1,w,h] 对应COCO的bbox格式
 
 def polygons_to_mask(self, img_shape, polygons):
  mask = np.zeros(img_shape, dtype=np.uint8)
  mask = PIL.Image.fromarray(mask)
  xy = list(map(tuple, polygons))
  PIL.ImageDraw.Draw(mask).polygon(xy=xy, outline=1, fill=1)
  mask = np.array(mask, dtype=bool)
  return mask
 
 def data2coco(self):
  data_coco = {}
  data_coco['images'] = self.images
  data_coco['categories'] = self.categories
  data_coco['annotations'] = self.annotations
  return data_coco
 
 def save_json(self):
  self.data_transfer()
  self.data_coco = self.data2coco()
  # 保存json文件
  json.dump(self.data_coco, open(self.save_json_path, 'w'), indent=4, cls=MyEncoder) # indent=4 更加美观显示
 
 
labelme_json = glob.glob('./Annotations/*.json')
# labelme_json=['./Annotations/*.json']
 
labelme2coco(labelme_json, './json/test.json')

以上这篇将labelme格式数据转化为标准的coco数据集格式方式就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Django日志模块logging的配置详解
Feb 14 Python
python 计算数组中每个数字出现多少次--“Bucket”桶的思想
Dec 19 Python
快速了解Python相对导入
Jan 12 Python
python 列表,数组,矩阵两两转换tolist()的实例
Apr 04 Python
Python3 关于pycharm自动导入包快捷设置的方法
Jan 16 Python
Python实现使用request模块下载图片demo示例
May 24 Python
Python处理时间日期坐标轴过程详解
Jun 25 Python
Pytoch之torchvision.transforms图像变换实例
Dec 30 Python
Python的PIL库中getpixel方法的使用
Apr 09 Python
使用Python内置模块与函数进行不同进制的数的转换
Apr 26 Python
Python定时从Mysql提取数据存入Redis的实现
May 03 Python
python基于爬虫+django,打造个性化API接口
Jan 21 Python
开启Django博客的RSS功能的实现方法
Feb 17 #Python
Python3打包exe代码2种方法实例解析
Feb 17 #Python
Django 博客实现简单的全文搜索的示例代码
Feb 17 #Python
Python使用qrcode二维码库生成二维码方法详解
Feb 17 #Python
django2.2 和 PyMySQL版本兼容问题
Feb 17 #Python
基于python3的socket聊天编程
Feb 17 #Python
python词云库wordCloud使用方法详解(解决中文乱码)
Feb 17 #Python
You might like
CI框架AR数据库操作常用函数总结
2016/11/21 PHP
建议大家看下JavaScript重要知识更新
2007/07/08 Javascript
JavaScript高级程序设计 DOM学习笔记
2011/09/10 Javascript
jQuery插件实现屏蔽单个元素使用户无法点击
2013/04/12 Javascript
jQuery中parents()方法用法实例
2015/01/07 Javascript
Javascript中typeof 用法小结
2015/05/12 Javascript
浅谈JavaScript的Polymer框架中的behaviors对象
2015/07/29 Javascript
谈谈我对JavaScript中typeof和instanceof的深入理解
2015/12/25 Javascript
实例讲解JS中setTimeout()的用法
2016/01/28 Javascript
多种js图片预加载实现方式分享
2016/02/19 Javascript
js的form表单提交url传参数(包含+等特殊字符)的两种解决方法
2016/05/25 Javascript
基于JavaScript FileReader上传图片显示本地链接
2016/05/27 Javascript
微信小程序实现点击按钮修改view标签背景颜色功能示例【附demo源码下载】
2017/12/06 Javascript
layui select获取自定义属性方法
2018/08/15 Javascript
Vuejs开发环境搭建及热更新【推荐】
2018/09/07 Javascript
js实现每日签到功能
2018/11/29 Javascript
Nuxt 嵌套路由nuxt-child组件用法(父子页面组件的传值)
2020/11/05 Javascript
[12:21]VICI vs TNC (BO3)
2018/06/07 DOTA
Python爬虫实现网页信息抓取功能示例【URL与正则模块】
2017/05/18 Python
Python协程的用法和例子详解
2017/09/09 Python
Python实现按中文排序的方法示例
2018/04/25 Python
python实现狄克斯特拉算法
2019/01/17 Python
使用Python快速制作可视化报表的方法
2019/02/03 Python
Python脚本利用adb进行手机控制的方法
2019/07/08 Python
Python参数类型以及常见的坑详解
2019/07/08 Python
在django模板中实现超链接配置
2019/08/21 Python
python实现代码审查自动回复消息
2021/02/01 Python
深入解读CSS3中transform变换模型的渲染
2016/05/27 HTML / CSS
凯特方迪化妆品官网:Kat Von D Beauty
2016/11/15 全球购物
中东奢侈品市场:Coveti
2019/05/12 全球购物
交通事故赔偿协议书
2014/10/16 职场文书
中班下学期幼儿评语
2014/12/30 职场文书
企业财务经理岗位职责
2015/04/08 职场文书
孔子观后感
2015/06/08 职场文书
2015年征兵工作总结
2015/07/23 职场文书
创业计划书之溜冰场
2019/10/25 职场文书