AI工具-标注工具labelme

简介: Labelme是一款Python开源图像标注工具,支持图像分类、目标检测、语义分割和实例分割等任务。它提供了一个GUI界面,用户可绘制圆形、方形和多边形进行标注。安装通过`pip install labelme`和`lxml`,使用时可导入预定义标签列表。标注结果保存为json文件,包含类别、边界框信息和形状类型。Labelme还支持格式转换,如转换为VOC或COCO格式。这款工具对视频标注也兼容。5月更文挑战第9天

AI工具-标注工具labelme

在人工智能领域,数据是一切应用的基础,特别是有标签的数据。今天介绍一款在图像视觉领域的基于python开源打标签工具Labelme, 该工具可以支持图像分类,目标检测, 语义分割和实例分割等最常见的视觉任务。

其他类似的工具有Labelimg

md-2022-03-27-22-37-18.png

1. 安装

lableme开源代码见 https://github.com/wkentaro/labelme

本地安装如下:

pip install labelme
pip install lxml

## 运行
./labelme

md-2022-03-15-11-39-02.png

2 使用

从上面的界面(pyQt)可以看出Labelme

  • 左边为标注的图形:支持圆形,方形 和多边形
  • 中间为图像标注区域
  • 右边为类别和文件信息

md-2022-03-15-13-58-13.png

作为打标工具,Labelme是支持在标注时再输入标签类别信息,但是建议在标注之前构建一个标签元数据,作为输入。

建议的使用步骤如下:

构建标签列表
创建标签名称label.txt,格式如下前面两行为固定

__ignore__
_background_
dog
cat

导入标签,并启动

labelme --labels label.txt

开始标注
根据标注任务的不同,Labelme会生成一个与图片名称相同的json文件,以目标检测为例,标注好的json样例为:

{
   
   
  "version": "4.6.0",
  "flags": {
   
   },
  "shapes": [
    {
   
   
      "label": "nochefclothes",
      "points": [
        [
          278.53846153846155,
          390.3076923                                                     
        ],
        [
          513.9230769230769,
          955.5384615384615
        ]
      ],
      "group_id": null,
      "shape_type": "rectangle",
      "flags": {
   
   }
    }
  ],
  "imagePath": "3a7b9c1896e19feab13bc201cbf2a86b.jpeg",
  "imageData": "",
  "imageHeight": 1000,
  "imageWidth": 798
}

可以看出

  • label为类别信息,
  • points为bounding box位置信息,如果是目标检测(方形)分别为左上(xmin,ymin)和右下(xmax, ymax)的坐标信息,如果是语义分割和实例分割,则为多个点
  • shape_type: 目标检测为rectangle, 语义分割和实例分割为polysgons

等标注完成,保存即可;标注完成之后想查看标注结果,可以通过不同的方式来打开

# 空白
labelme --labels label.txt

# 单图json
labelme ./img1.json --labels label.txt

# 目录方式
labelme ./img_dir --labels label.txt

另外,Labelme也是支持视频标注的。通过视频抽帧之后再标注。

3. 格式转换

由于Labelme是按照json格式来保存标注结果的,这和现有的常用任务格式有些区别,如目标检测的VOC COCO等,Labelme也提供的相应的转换工具脚本进行转换,十分方便。

  • 转换voc
# It generates:
#   - data_dataset_voc/JPEGImages
#   - data_dataset_voc/SegmentationClass
#   - data_dataset_voc/SegmentationClassVisualization
#   - data_dataset_voc/SegmentationObject
#   - data_dataset_voc/SegmentationObjectVisualization
./labelme2voc.py data_annotated data_dataset_voc --labels labels.txt

python -u labelme2voc.py ./multi_defect ./multi_defect_voc --labels ./labels.txt --noviz
  • 转换coco
# It generates:
#   - data_dataset_coco/JPEGImages
#   - data_dataset_coco/annotations.json
./labelme2coco.py data_annotated data_dataset_coco --labels labels.txt

4. 总结

本文简单分享了开源标注工具Labelme的使用,希望对你有帮助。先总结如下:

  • labelme适用于图像分类、目标检测、语义分割、实例分割
  • labelme 图片视频都可用
  • 开始新建立标签文件,记住前两行是固定的(没有特别的含义,就是代码逻辑是这样的)
  • json注意label,points和shape_type
  • labelme2voc和labelme2coco来转换经典格式
目录
相关文章
|
2天前
|
人工智能 自然语言处理 搜索推荐
你用过最好用的AI工具是什么?
2023年AI革命风起云涌,众多产品令人振奋。我体验了OpenAI的ChatGPT、微软New Bing、Anthropic Claude等多款AI产品。特别推荐微软New Bing,它集成了强大的搜索引擎和语言模型,回答问题精准,提供最新信息,还能免费进行创意绘图。此外,New Bing还集成了Copilot网页助手,帮助用户高效提取和总结内容。
49 27
你用过最好用的AI工具是什么?
|
2天前
|
机器学习/深度学习 人工智能 算法
X-AnyLabeling:开源的 AI 图像标注工具,支持多种标注样式,适于目标检测、图像分割等不同场景
X-AnyLabeling是一款集成了多种深度学习算法的图像标注工具,支持图像和视频的多样化标注样式,适用于多种AI训练场景。本文将详细介绍X-AnyLabeling的功能、技术原理以及如何运行该工具。
21 2
X-AnyLabeling:开源的 AI 图像标注工具,支持多种标注样式,适于目标检测、图像分割等不同场景
|
10天前
|
编解码 人工智能 监控
VISION XL:支持四倍超分辨率的 AI 视频修复处理工具,提供去除模糊、修复缺失等功能
VISION XL是一款基于潜在扩散模型的高效视频修复和超分辨率工具,能够修复视频缺失部分、去除模糊,并支持四倍超分辨率。该工具优化了处理效率,适合快速处理视频的应用场景。
56 6
VISION XL:支持四倍超分辨率的 AI 视频修复处理工具,提供去除模糊、修复缺失等功能
|
16天前
|
存储 人工智能 数据库
Codel:AI代理工具,支持在终端、浏览器、编辑器执行复杂任务和项目
Codel是一款全自主AI代理工具,支持在终端、浏览器和编辑器中执行复杂任务和项目。它运行在沙盒化的Docker环境中,具备自主操作能力,内置浏览器和文本编辑器,所有操作记录存储于PostgreSQL数据库。Codel能够自动完成复杂任务,如创建项目结构、进行网络搜索等,适用于自动化编程、研究与开发、教育与培训以及数据科学与分析等多个领域。
55 11
Codel:AI代理工具,支持在终端、浏览器、编辑器执行复杂任务和项目
|
19天前
|
机器学习/深度学习 人工智能 自然语言处理
Voice-Pro:开源AI音频处理工具,集成转录、翻译、TTS等一站式服务
Voice-Pro是一款开源的多功能音频处理工具,集成了语音转文字、文本转语音、实时翻译、YouTube视频下载和人声分离等多种功能。它支持超过100种语言,适用于教育、娱乐和商业等多个领域,为用户提供一站式的音频处理解决方案,极大地提高工作效率和音频处理的便捷性。
90 10
Voice-Pro:开源AI音频处理工具,集成转录、翻译、TTS等一站式服务
|
18天前
|
Web App开发 机器学习/深度学习 人工智能
Magic Copy:开源的 AI 抠图工具,在浏览器中自动识别图像进行抠图
Magic Copy 是一款开源的 AI 抠图工具,支持 Chrome 浏览器扩展。它基于 Meta 的 Segment Anything Model 技术,能够自动识别图像中的前景对象并提取出来,简化用户从图片中提取特定元素的过程,提高工作效率。
59 7
Magic Copy:开源的 AI 抠图工具,在浏览器中自动识别图像进行抠图
|
18天前
|
人工智能 自然语言处理 API
吴恩达开源aisuite:简化AI模型调用的新工具 | AI工具
近日,著名人工智能学者吴恩达教授在推特上宣布了他的最新开源项目——aisuite。这款全新的Python包旨在简化开发者与各大AI模型服务商的集成过程,极大提升了应用开发的效率。aisuite的推出,无疑为人工智能领域的开发者带来了一个强大而便利的工具。
63 5
|
5天前
|
机器学习/深度学习 人工智能 自然语言处理
AI技术深度解析:从基础到应用的全面介绍
人工智能(AI)技术的迅猛发展,正在深刻改变着我们的生活和工作方式。从自然语言处理(NLP)到机器学习,从神经网络到大型语言模型(LLM),AI技术的每一次进步都带来了前所未有的机遇和挑战。本文将从背景、历史、业务场景、Python代码示例、流程图以及如何上手等多个方面,对AI技术中的关键组件进行深度解析,为读者呈现一个全面而深入的AI技术世界。
52 10
|
9天前
|
机器学习/深度学习 人工智能 自然语言处理
转载:【AI系统】AI的领域、场景与行业应用
本文概述了AI的历史、现状及发展趋势,探讨了AI在计算机视觉、自然语言处理、语音识别等领域的应用,以及在金融、医疗、教育、互联网等行业中的实践案例。随着技术进步,AI模型正从单一走向多样化,从小规模到大规模分布式训练,企业级AI系统设计面临更多挑战,同时也带来了新的研究与工程实践机遇。文中强调了AI基础设施的重要性,并鼓励读者深入了解AI系统的设计原则与研究方法,共同推动AI技术的发展。
转载:【AI系统】AI的领域、场景与行业应用
|
5天前
|
机器学习/深度学习 人工智能 算法
探索AI在医疗诊断中的应用与挑战
【10月更文挑战第21天】 本文深入探讨了人工智能(AI)技术在医疗诊断领域的应用现状与面临的挑战,旨在为读者提供一个全面的视角,了解AI如何改变传统医疗模式,以及这一变革过程中所伴随的技术、伦理和法律问题。通过分析AI技术的优势和局限性,本文旨在促进对AI在医疗领域应用的更深层次理解和讨论。
下一篇
DataWorks