计算机视觉常用图像数据集标记平台

简介: 计算机视觉常用图像数据集标记平台

目录

1、LabelIMG


2、VGG Image Annotator


3、Supervise.ly


4、Labelbox


5、其他平台


在计算机视觉中海量图片数据的标记是个让人头疼的问题,通过学习总结列举以下几种常用的图像标记平台,从平台的价格、各种功能、工具和格式、项目管理和易用性等方面分析各个平台的特点,希望对小伙伴们有所帮助。


1、LabelIMG

LabelImg是一个开源图像标记工具,它为Windows预先构建了二进制文件,因此它非常易于安装。

image.png



价格:免费


功能:仅支持边界框(还有一个RotatedRect格式的版本和一个类标记的优化版本),但没有更高级的功能。格式为PascalVoc XML,并且为源文件夹中的每个图像单独保存注释文件。


项目管理:它没有项目管理属性,但它确实允许一种简单的方法来导入和可视化注释并在必要时进行更正。简单的离线界面使得注释过程非常快,即使它不支持许多热键快捷方式。


GitHub网址:https://github.com/tzutalin/labelImg


2、VGG Image Annotator

VGG是一个开源工具,就像LabelImg一样,它可以很好地完成不需要项目管理的简单任务。它可以作为在线接口使用,也可以作为HTML文件离线使用。

image.png



价格:免费


功能:提供了更多的工具,包括点、线、多边形、圆和椭圆(仅在此列表中支持圆和椭圆!)还可以添加对象和图像属性/标签。注释可以作为一个包含所有注释的JSON文件下载,也可以作为一个CSV文件下载,如果需要查看注释,还可以在之后上传。


项目管理:在数据集管理和用户方面没有什么先进的功能,但是它的界面是多边形注释最有效和最精确的界面之一,因为它允许您查看多边形的线条而不是其他任何内容。它们支持一些热键快捷方式,一般来说应用程序非常轻量级。


网址:http://www.robots.ox.ac.uk/~vgg/software/via/


3、Supervise.ly

Supervis.ly是一个非常棒的基于web的平台,它提供了一个高级的注释接口,同时还提供了一个自托管的基础设施,用于模型培训和改进。

image.png



价格:模型培训版的免费社区版和企业定价


功能性:一系列工具,包括点,线,盒,多边形和用于语义分割的位图画笔(我们还没有发现它们的智能工具太有用了)。还包括在多边形中绘制孔的可能性,这是非常有价值的。另一个非常有用的功能是添加图像和对象标签以及在图层中排序图形的选项。每个图像或PNG蒙版的输出都在JSON文件中,平台还允许您上传Cityscapes和COCO等格式。此外,还可以选择直接在平台上进行数据转换。


项目管理:该平台为数据集管理提供了大量选项,包括为用户添加细化权限,监控性能统计,标记对象等。缺少的一些事情是时间统计和质量控制机制。他们的技术支持团队随时可以解决问题。该界面允许非常精确的工作并支持可定制的热键快捷方式,但最近性能有时很慢,如果平台需要花费大量时间在图像之间切换和记录注释,这可能会非常令人沮丧。


网址:https://supervise.ly/


4、Labelbox

Labelbox是另一个伟大的基于网络的平台,于2018年初推出,从那时起不断更新和改进其功能。它还提供了通过导入模型预测并查看贴标机和模型之间的共识来集成人在环的可能性。

image.png



定价:免费社区版仅限5000张图片和企业版


功能性:提供完整的注释工具,如点,线,盒和多边形,最近为他们的语义分割画笔添加了一个很棒的新功能 – 一个超级像素着色选项,使生活变得如此简单(就像这样和这个开源工具)。输出是一个包含所有注释或PNG掩码的JSON或CSV文件(但是,每个类都有一个掩码,用户需要弄清楚如何处理重叠区域)


项目管理:设置项目非常简单,监控性能有很多选项,包括标记图像所需的秒数统计,以及激活不同贴标机之间的自动共识。您可以选择邀请用户(虽然权限不是那么精细)并查看每个用户的工作。标签界面非常人性化,并支持热键快捷键(虽然不可自定义)。免费版中缺少的一件事是上传注释以便可视化或编辑它们的选项。


网址:https://labelbox.com/


5、其他平台

Diffgram :一个非常有前途的平台仍然在beta版,通过训练RCNN优化图像注释。


RectLabel :用于为MacOS绑定框和多边形的绝佳工具。


Prodigy:它们提供了一个自托管的后端,具有不同的注释接口,包括带有边框的图像注释;他们的产品定价从390美元起,供个人使用(每位用户终身使用)。


DataTurks:提供许多注释功能的平台,免费版本中注释的数据是公开的,小型团队的企业定价从每月300美元开始。


ImageTagger :一个用于协作图像标签的开源平台。


Fast Annotation Tool  :另一个开源工具,使用OpenCV用于RotatedRect格式的边界框。


LabelMe :麻省理工学院用于多边形注释的行业经典开源工具,但精度非常低。


PolygonRNN++: 仅作为演示版提供,但仍然非常有前景;在Cityscapes数据集上训练的工具确实为自动驾驶汽车生成自动标签,并加强学习。


相关文章
|
14天前
|
机器学习/深度学习 编解码 自动驾驶
计算机视觉之图像到图像的翻译
图像到图像的翻译(Image-to-Image Translation)是指将一种图像从一种表示转换为另一种表示的过程。该任务的目标是在保证图像语义信息的前提下,将图像风格、颜色或其他视觉特征进行转换。该技术在计算机视觉领域具有广泛应用,例如图像风格迁移、图像修复、图像增强、超分辨率、语义分割等。
18 4
|
26天前
|
存储 人工智能 数据可视化
AI计算机视觉笔记二十一:PaddleOCR训练自定义数据集
在完成PaddleOCR环境搭建与测试后,本文档详细介绍如何训练自定义的车牌检测模型。首先,在`PaddleOCR`目录下创建`train_data`文件夹存放数据集,并下载并解压缩车牌数据集。接着,复制并修改配置文件`ch_det_mv3_db_v2.0.yml`以适应训练需求,包括设置模型存储目录、训练可视化选项及数据集路径。随后,下载预训练权重文件并放置于`pretrain_models`目录下,以便进行预测与训练。最后,通过指定命令行参数执行训练、断点续训、测试及导出推理模型等操作。
|
26天前
|
人工智能 数据处理 计算机视觉
AI计算机视觉笔记十六:yolov5训练自己的数据集
本文介绍了一种利用云服务器AutoDL训练疲劳驾驶行为检测模型的方法。由于使用本地CPU训练效率低下,作者选择了性价比高的AutoDL云服务器。首先,从网络获取了2000多张疲劳驾驶行为图片并使用labelimg软件进行标注。接着,详细介绍了在云服务器上创建实例、上传数据集和YOLOv5模型、修改配置文件以及开始训练的具体步骤。整个训练过程耗时约3小时,最终生成了可用于检测的模型文件。
|
5月前
|
编解码 边缘计算 自然语言处理
2024年5月计算机视觉论文推荐:包括扩散模型、视觉语言模型、图像编辑和生成、视频处理和生成以及图像识别等各个主题
五月发布的计算机视觉领域重要论文涵盖了扩散模型、视觉语言模型、图像生成与编辑及目标检测。亮点包括:1) Dual3D提出双模式推理策略,实现高效文本到3D图像生成;2) CAT3D利用多视图扩散模型创建3D场景,仅需少量图像;3) Hunyuan-DiT是多分辨率的中文理解扩散Transformer,可用于多模态对话和图像生成;4) 通过潜在扩散模型从EEG数据重建自然主义音乐,展示复杂音频重建潜力。此外,还有关于视觉语言模型和图像编辑的创新工作,如BlobGEN用于合成具有控制性的图像。
112 3
|
3月前
|
机器学习/深度学习 XML 计算机视觉
OpenCV(Open Source Computer Vision Library)是一个开源的计算机视觉和机器学习库,它提供了大量的函数和工具,用于处理图像和视频数据。
OpenCV(Open Source Computer Vision Library)是一个开源的计算机视觉和机器学习库,它提供了大量的函数和工具,用于处理图像和视频数据。
|
4月前
|
算法 计算机视觉 Python
openCV 3计算机视觉 Python语言实现 笔记 第三章 使用OpenCV 3处理图像
openCV 3计算机视觉 Python语言实现 笔记 第三章 使用OpenCV 3处理图像
|
5月前
|
文字识别 算法 TensorFlow
【Keras+计算机视觉+Tensorflow】OCR文字识别实战(附源码和数据集 超详细必看)
【Keras+计算机视觉+Tensorflow】OCR文字识别实战(附源码和数据集 超详细必看)
152 2
|
5月前
|
算法 数据库 计算机视觉
【计算机视觉】FCN、Seg-Net、U-Net模型进行图像分割实战(附源码和数据集 超详细必看)
【计算机视觉】FCN、Seg-Net、U-Net模型进行图像分割实战(附源码和数据集 超详细必看)
204 2
|
5月前
|
机器学习/深度学习 算法 TensorFlow
【Keras+计算机视觉+Tensorflow】实现基于YOLO和Deep Sort的目标检测与跟踪实战(附源码和数据集)
【Keras+计算机视觉+Tensorflow】实现基于YOLO和Deep Sort的目标检测与跟踪实战(附源码和数据集)
82 1
|
5月前
|
机器学习/深度学习 自动驾驶 算法
【计算机视觉+自动驾驶】二、多任务深度学习网络并联式、级联式构建详细讲解(图像解释 超详细必看)
【计算机视觉+自动驾驶】二、多任务深度学习网络并联式、级联式构建详细讲解(图像解释 超详细必看)
231 1

热门文章

最新文章

下一篇
无影云桌面