【技术分享】计算机视觉常见的十种图像标注方法

简介: 【技术分享】计算机视觉常见的十种图像标注方法

1.语义分割

语义分割是指根据物体的属性,对复杂不规则图片进行进行区域划分,并标注对应上属性,以帮助训练图像识别模型,常应用于自动驾驶、人机交互、虚拟现实等领域。

f2fa9462cace43d3905f676ff82c2c9f_58e6a8fb933f4d848cdbb8b8bf32cd6e.png


2.矩形框标注

矩形框标注又叫拉框标注,拉框标注是图像标注中极为常见的一种任务类型,主要是指用2D框、3D框、多边形框等标注出图像中的指定目标对象。


66903610b1a92b6816261e92b19b4925_20d133d11bef49c9b3358e4ffbfe110f.png


3.多边形标注

多边形标注是指在静态图片中,使用多边形框,标注出不规则的目标物体,相对于矩形框标注,多边形标注能够更精准地框定目标,同时对于不规则物体,也更具针对性。

ea3edc4df90028b0eb0197c70743ea4b_c3fb8d8bb0f84fd4a5dfe88a5d00a92a.png


4.关键点标注

关键点标注是指在目标对象的规定位置打上关键点,例如在人脸图片上用点标注出眼角、鼻尖、嘴角等关键位置或者在人体图像上标出骨骼或穴位的位置等。

ebbb4bd6565c38bd3c941c0208e36c32_a71b3a644ab341f6ba20b233cfd5556b.png



5.立方体标注

将2D图片中的车辆进行3D标注,主要应用于训练自动驾驶对会车或超车车辆的体积判断。


6c681688791c0de2ee8c71b1f6b43bf2_11e4f8ac85044d2f8277c1f33570370a.png


6.3D点云标注

3D点云标注是指从激光雷达采集的点云图中找出目标对象,并以立方体框的形式标注出来,其中包括车辆、行人、广告标志和树木等。


fb74b5c36be5851849d4a8fa4d7b09c0_6daf5e6b108146738ac70fb0bda53253.png


7.2D/3D融合标注

2D/3D融合标注是指同时对2D和3D传感器所采集到的图像数据进行标注,并建立关联。该方法能够标注出物体在平面和立体中的位置和大小,帮助自动驾驶模型增强视觉和雷达感知。


8.目标追踪

目标跟踪是从视频数据中按帧捕捉某一对象,并进行画框标注。在军事制导、视频监控、机器人视觉导航、人机交互,以及医疗诊断等许多方面有着广泛的应用前景。


9.OCR转写

OCR转写是对图像中的文字内容进行标记与转写,帮助训练和完善图片与文本识别模型。


b8c83573a86adc20c5b1fb8d6529f27c_f770655fbf804988812e38a98e5cb848.png


10.属性识别

属性识别是指通过人工或机器配合的方式,识别出图像中的目标物体,并将其标注上对应属性,例如:性别识别、种族识别、年龄估计、表情识别。


0641b869b3437fa0bba98a345c4893b4_4a4582f5a7d04951ac6c409d317a858e.png

目录
相关文章
|
11月前
|
机器学习/深度学习 自然语言处理 文字识别
【计算机视觉】CLIP:连接文本和图像(关于CLIP的一些补充说明)
我们推出了一个名为CLIP的神经网络,它可以有效地从自然语言监督中学习视觉概念。CLIP可以应用于任何视觉分类基准,只需提供要识别的视觉类别名称,类似于GPT-2和GPT-3的“零样本”功能。
|
9天前
|
编解码 边缘计算 自然语言处理
2024年5月计算机视觉论文推荐:包括扩散模型、视觉语言模型、图像编辑和生成、视频处理和生成以及图像识别等各个主题
五月发布的计算机视觉领域重要论文涵盖了扩散模型、视觉语言模型、图像生成与编辑及目标检测。亮点包括:1) Dual3D提出双模式推理策略,实现高效文本到3D图像生成;2) CAT3D利用多视图扩散模型创建3D场景,仅需少量图像;3) Hunyuan-DiT是多分辨率的中文理解扩散Transformer,可用于多模态对话和图像生成;4) 通过潜在扩散模型从EEG数据重建自然主义音乐,展示复杂音频重建潜力。此外,还有关于视觉语言模型和图像编辑的创新工作,如BlobGEN用于合成具有控制性的图像。
20 3
|
19天前
|
机器学习/深度学习 计算机视觉 Python
【Python计算机视觉】项目实战之图像增强imguag对关键点变换、标注框变化(附源码 超详细必看)
【Python计算机视觉】项目实战之图像增强imguag对关键点变换、标注框变化(附源码 超详细必看)
84 0
|
19天前
|
机器学习/深度学习 算法 数据处理
【计算机视觉】数据获取、数据标注、数据增强的概念简介
【计算机视觉】数据获取、数据标注、数据增强的概念简介
77 0
|
19天前
|
机器学习/深度学习 自动驾驶 算法
【计算机视觉+自动驾驶】二、多任务深度学习网络并联式、级联式构建详细讲解(图像解释 超详细必看)
【计算机视觉+自动驾驶】二、多任务深度学习网络并联式、级联式构建详细讲解(图像解释 超详细必看)
102 1
|
8月前
|
算法 vr&ar 计算机视觉
[笔记]Python计算机视觉编程《二》 基本的图像操作和处理
[笔记]Python计算机视觉编程《二》 基本的图像操作和处理
|
8月前
|
存储 算法 程序员
[笔记]Python计算机视觉编程《一》 基本的图像操作和处理(四)
[笔记]Python计算机视觉编程《一》 基本的图像操作和处理(四)
|
8月前
|
存储 Serverless C语言
[笔记]Python计算机视觉编程《一》 基本的图像操作和处理(三)
[笔记]Python计算机视觉编程《一》 基本的图像操作和处理(三)
|
8月前
|
安全 数据挖掘 计算机视觉
[笔记]Python计算机视觉编程《一》 基本的图像操作和处理(二)
[笔记]Python计算机视觉编程《一》 基本的图像操作和处理(二)
|
8月前
|
XML 算法 计算机视觉
[笔记]Python计算机视觉编程《一》 基本的图像操作和处理(一)
[笔记]Python计算机视觉编程《一》 基本的图像操作和处理

热门文章

最新文章