将labelme格式数据转化为标准的coco数据集格式方式


Posted in Python onFebruary 17, 2020

labelme标注图像生成的json格式:

{
 "version": "3.11.2",
 "flags": {},
 "shapes": [# 每个对象的形状
 { # 第一个对象
  "label": "malignant",
  "line_color": null,
  "fill_color": null,
  "points": [# 边缘是由点构成,将这些点连在一起就是对象的边缘多边形
  [
   371, # 第一个点 x 坐标
   257 # 第一个点 y 坐标
  ],
  ...
  [
   412,
   255
  ]
  ],
  "shape_type": "polygon" # 形状类型:多边形
 },
 {
  "label": "malignant", # 第一个对象的标签
  "line_color": null,
  "fill_color": null,
  "points": [# 第二个对象
  [
   522,
   274
  ],
  ...
  [
   561,
   303
  ]
  ],
  "shape_type": "polygon"
 },
 {
  "label": "malignant", # 第二个对象的标签
  "line_color": null,
  "fill_color": null,
 "imagePath": "../../val2017/000001.jpg", # 原始图片的路径
 "imageData":"something too long ",# 原图像数据 通过该字段可以解析出原图像数据
 "imageHeight": 768,
 "imageWidth": 1024
}

coco标准数据集格式:

COCO通过大量使用Amazon Mechanical Turk来收集数据。COCO数据集现在有3种标注类型:object instances(目标实例), object keypoints(目标上的关键点), and image captions(看图说话),使用JSON文件存储。

基本的JSON结构体类型

这3种类型共享下面所列的基本类型,包括image、categories、annotation类型。

Images类型:

"images": [
  {
   "height": 768,
   "width": 1024,
   "id": 1, #图片id
   "file_name": "000002.jpg"
  }
]

categories类型:

"categories": [
  {
   "supercategory": "Cancer", #父类
   "id": 1,   #标签类别id,0表示背景
   "name": "benign" #子类
  },
  {
   "supercategory": "Cancer",
   "id": 2,
   "name": "malignant"
  }
 ],

annotations类型:

"annotations": [
  {
   "segmentation": [#坐标点的坐标值
    [
     418,
     256,
     391,
     293,
     406,
     323,
     432,
     340,
     452,
     329,
     458,
     311,
     458,
     286,
     455,
     277,
     439,
     264,
     418,
     293,
     391,
     256
    ]
   ],
   "iscrowd": 0, #单个的对象(iscrowd=0)可能需要多个polygon来表示
   "image_id": 1, #和image的id保持一致
   "bbox": [  #标注的边框值 bbox是将segmentation包起来的水平矩形
    391.0,
    256.0,
    67.0,
    84.0
   ],
   "area": 5628.0, #标注的边框面积
   "category_id": 1, #所属类别id
   "id": 1   #标注边框的id : 1,2,3...,n
  }
]

labelme 转化为coco

# -*- coding:utf-8 -*-
# !/usr/bin/env python
 
import argparse
import json
import matplotlib.pyplot as plt
import skimage.io as io
import cv2
from labelme import utils
import numpy as np
import glob
import PIL.Image
 
class MyEncoder(json.JSONEncoder):
 def default(self, obj):
  if isinstance(obj, np.integer):
   return int(obj)
  elif isinstance(obj, np.floating):
   return float(obj)
  elif isinstance(obj, np.ndarray):
   return obj.tolist()
  else:
   return super(MyEncoder, self).default(obj)
 
class labelme2coco(object):
 def __init__(self, labelme_json=[], save_json_path='./tran.json'):
  '''
  :param labelme_json: 所有labelme的json文件路径组成的列表
  :param save_json_path: json保存位置
  '''
  self.labelme_json = labelme_json
  self.save_json_path = save_json_path
  self.images = []
  self.categories = []
  self.annotations = []
  # self.data_coco = {}
  self.label = []
  self.annID = 1
  self.height = 0
  self.width = 0
 
  self.save_json()
 
 def data_transfer(self):
 
  for num, json_file in enumerate(self.labelme_json):
   with open(json_file, 'r') as fp:
    data = json.load(fp) # 加载json文件
    self.images.append(self.image(data, num))
    for shapes in data['shapes']:
     label = shapes['label']
     if label not in self.label:
      self.categories.append(self.categorie(label))
      self.label.append(label)
     points = shapes['points']#这里的point是用rectangle标注得到的,只有两个点,需要转成四个点
     #points.append([points[0][0],points[1][1]])
     #points.append([points[1][0],points[0][1]])
     self.annotations.append(self.annotation(points, label, num))
     self.annID += 1
 
 def image(self, data, num):
  image = {}
  img = utils.img_b64_to_arr(data['imageData']) # 解析原图片数据
  # img=io.imread(data['imagePath']) # 通过图片路径打开图片
  # img = cv2.imread(data['imagePath'], 0)
  height, width = img.shape[:2]
  img = None
  image['height'] = height
  image['width'] = width
  image['id'] = num + 1
  #image['file_name'] = data['imagePath'].split('/')[-1]
  image['file_name'] = data['imagePath'][3:14]
  self.height = height
  self.width = width
 
  return image
 
 def categorie(self, label):
  categorie = {}
  categorie['supercategory'] = 'Cancer'
  categorie['id'] = len(self.label) + 1 # 0 默认为背景
  categorie['name'] = label
  return categorie
 
 def annotation(self, points, label, num):
  annotation = {}
  annotation['segmentation'] = [list(np.asarray(points).flatten())]
  annotation['iscrowd'] = 0
  annotation['image_id'] = num + 1
  # annotation['bbox'] = str(self.getbbox(points)) # 使用list保存json文件时报错(不知道为什么)
  # list(map(int,a[1:-1].split(','))) a=annotation['bbox'] 使用该方式转成list
  annotation['bbox'] = list(map(float, self.getbbox(points)))
  annotation['area'] = annotation['bbox'][2] * annotation['bbox'][3]
  # annotation['category_id'] = self.getcatid(label)
  annotation['category_id'] = self.getcatid(label)#注意,源代码默认为1
  annotation['id'] = self.annID
  return annotation
 
 def getcatid(self, label):
  for categorie in self.categories:
   if label == categorie['name']:
    return categorie['id']
  return 1
 
 def getbbox(self, points):
  # img = np.zeros([self.height,self.width],np.uint8)
  # cv2.polylines(img, [np.asarray(points)], True, 1, lineType=cv2.LINE_AA) # 画边界线
  # cv2.fillPoly(img, [np.asarray(points)], 1) # 画多边形 内部像素值为1
  polygons = points
 
  mask = self.polygons_to_mask([self.height, self.width], polygons)
  return self.mask2box(mask)
 
 def mask2box(self, mask):
  '''从mask反算出其边框
  mask:[h,w] 0、1组成的图片
  1对应对象,只需计算1对应的行列号(左上角行列号,右下角行列号,就可以算出其边框)
  '''
  # np.where(mask==1)
  index = np.argwhere(mask == 1)
  rows = index[:, 0]
  clos = index[:, 1]
  # 解析左上角行列号
  left_top_r = np.min(rows) # y
  left_top_c = np.min(clos) # x
 
  # 解析右下角行列号
  right_bottom_r = np.max(rows)
  right_bottom_c = np.max(clos)
 
  # return [(left_top_r,left_top_c),(right_bottom_r,right_bottom_c)]
  # return [(left_top_c, left_top_r), (right_bottom_c, right_bottom_r)]
  # return [left_top_c, left_top_r, right_bottom_c, right_bottom_r] # [x1,y1,x2,y2]
  return [left_top_c, left_top_r, right_bottom_c - left_top_c,
    right_bottom_r - left_top_r] # [x1,y1,w,h] 对应COCO的bbox格式
 
 def polygons_to_mask(self, img_shape, polygons):
  mask = np.zeros(img_shape, dtype=np.uint8)
  mask = PIL.Image.fromarray(mask)
  xy = list(map(tuple, polygons))
  PIL.ImageDraw.Draw(mask).polygon(xy=xy, outline=1, fill=1)
  mask = np.array(mask, dtype=bool)
  return mask
 
 def data2coco(self):
  data_coco = {}
  data_coco['images'] = self.images
  data_coco['categories'] = self.categories
  data_coco['annotations'] = self.annotations
  return data_coco
 
 def save_json(self):
  self.data_transfer()
  self.data_coco = self.data2coco()
  # 保存json文件
  json.dump(self.data_coco, open(self.save_json_path, 'w'), indent=4, cls=MyEncoder) # indent=4 更加美观显示
 
 
labelme_json = glob.glob('./Annotations/*.json')
# labelme_json=['./Annotations/*.json']
 
labelme2coco(labelme_json, './json/test.json')

以上这篇将labelme格式数据转化为标准的coco数据集格式方式就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
基于Django模板中的数字自增(详解)
Sep 05 Python
python中in在list和dict中查找效率的对比分析
May 04 Python
django 自定义过滤器的实现
Feb 26 Python
更新修改后的Python模块方法
Mar 03 Python
10 行Python 代码实现 AI 目标检测技术【推荐】
Jun 14 Python
Python 实现自动导入缺失的库
Oct 29 Python
浅析python 动态库m.so.1.0错误问题
May 09 Python
jupyter notebook运行命令显示[*](解决办法)
May 18 Python
python 读txt文件,按‘,’分割每行数据操作
Jul 05 Python
使用PyCharm官方中文语言包汉化PyCharm
Nov 18 Python
五分钟学会怎么用Pygame做一个简单的贪吃蛇
Jan 06 Python
Python使用openpyxl复制整张sheet
Mar 24 Python
开启Django博客的RSS功能的实现方法
Feb 17 #Python
Python3打包exe代码2种方法实例解析
Feb 17 #Python
Django 博客实现简单的全文搜索的示例代码
Feb 17 #Python
Python使用qrcode二维码库生成二维码方法详解
Feb 17 #Python
django2.2 和 PyMySQL版本兼容问题
Feb 17 #Python
基于python3的socket聊天编程
Feb 17 #Python
python词云库wordCloud使用方法详解(解决中文乱码)
Feb 17 #Python
You might like
让php处理图片变得简单 基于gb库的图片处理类附实例代码下载
2011/05/17 PHP
PHP数据库调用类调用实例(详细注释)
2012/07/12 PHP
php读取目录所有文件信息dir示例
2014/03/18 PHP
Zend Framework使用Zend_Loader组件动态加载文件和类用法详解
2016/12/09 PHP
PHP中register_shutdown_function函数的基础介绍与用法详解
2017/11/28 PHP
php+Ajax处理xml与json格式数据的方法示例
2019/03/04 PHP
php将字符串转换为数组实例讲解
2020/05/05 PHP
利用JS自动打开页面上链接的实现代码
2011/09/25 Javascript
JavaScript验证18位身份证号码最后一位正确性的实现代码
2014/08/07 Javascript
form.submit()不能提交表单的错误原因及解决方法
2014/10/13 Javascript
60个很实用的jQuery代码开发技巧收集
2014/12/15 Javascript
JS Input里添加小图标的两种方法
2017/11/11 Javascript
解决vue-cli + webpack 新建项目出错的问题
2018/03/20 Javascript
详解vue的diff算法原理
2018/05/20 Javascript
vue实现点击隐藏与显示实例分享
2019/02/13 Javascript
vue项目中实现缓存的最佳方案详解
2019/07/11 Javascript
JavaScript制作3D旋转相册
2020/08/02 Javascript
vue 判断两个时间插件结束时间必选大于开始时间的代码
2020/11/04 Javascript
KMP算法精解及其Python版的代码示例
2016/06/01 Python
linux平台使用Python制作BT种子并获取BT种子信息的方法
2017/01/20 Python
python excel使用xlutils类库实现追加写功能的方法
2018/05/02 Python
对python requests的content和text方法的区别详解
2018/10/11 Python
解决pyinstaller打包exe文件出现命令窗口一闪而过的问题
2018/10/31 Python
详解Pycharm出现out of memory的终极解决方法
2020/03/03 Python
详解Python3.8+PyQt5+pyqt5-tools+Pycharm配置详细教程
2020/11/02 Python
python爬虫工具例举说明
2020/11/30 Python
CSS3实现水平居中、垂直居中、水平垂直居中的实例代码
2020/02/27 HTML / CSS
HTML5全屏(Fullscreen)API详细介绍
2015/04/24 HTML / CSS
装潢设计实习自我鉴定
2013/09/19 职场文书
校班主任推荐信范文
2013/12/03 职场文书
矿泉水广告词
2014/03/20 职场文书
新年爱情寄语
2014/04/08 职场文书
美术学专业求职信
2014/07/23 职场文书
普通党员个人剖析材料
2014/10/08 职场文书
反邪教观后感
2015/06/11 职场文书
利用Python实现模拟登录知乎
2022/05/25 Python