目标检测基础(一)

本文涉及的产品
实时数仓Hologres,5000CU*H 100GB 3个月
智能开放搜索 OpenSearch行业算法版,1GB 20LCU 1个月
检索分析服务 Elasticsearch 版,2核4GB开发者规格 1个月
简介: 目标检测基础(一)

开发者学习笔记【阿里云人工智能工程师ACA认证(2023版):目标检测基础(一)

课程地址:https://edu.aliyun.com/course/3112108/lesson/19275

 

目标检测基础(一)

 

内容介绍

一、 目标检测的定义

二、 目标检测的评估指标

三、 目标检测遇到的挑战

四、目标检测的常用数据集与网络

五、目标检测的典型应用

 

提问:

图片574.png

在了解目标测之前,我们来看一下这个图。图中有一只猫。现在让我们思考一个问题,不仅要识别这张图片中的猫,还要确定这只猫在图中的具体位置,也就是它在图片中的哪个区域。这可以通过目标检测技术来实现,即框出猫的位置并标出坐标。

 

一、目标检测的定义


图片575.png

目标检测是一种识别图像中存在哪些物体并确定它们的类别以及它们在图像中的位置的任务。人们很容易理解图中的眼镜的位置,这支笔的位置。我们希望计算机视觉也能做到这一点。

具体来说,目标检测的任务是给定一张图片,然后在图像中找到可能的目标,识别它们,并确定它们的位置。不仅要识别出目标,还要知道它们的具体位置,即用框标出它们的位置。这就是目标检测要完成的任务。


目标检测也被称为对象检测,它是计算机视觉领域的一个核心问题。由于物体具有不同的外观、形状、姿态以及可能受到光照和遮挡的影响,目标检测是一个具有挑战性的问题。

现在,让我们来看一下图像分类和目标检测之间的区别。图像分类只需要将图像分到一个类别中,因此它只会给出一个单一的标签,指示图像属于哪个类别。

图像分类的核心是从给定的集合中给图像分配一个标签。

图像分类读取该图片;


生成该图片属于集合{dog,cat,hat,mouse}中各个标签的概率。

这对于像识别猫这样的任务相对简单。然而,目标检测更为复杂,因为它需要识别图像中的目标,可能是一个或多个,并且需要找到它们在图像中的具体位置,然后用边界框标记出来。这两者之间的差异很大。

图片576.png

 

二、目标检测的评估指标


图片577.png

在目标检测中,最重要的评估指标之一是交并比(IoU),类似于分类任务中的分类准确率。在目标检测中,我们不能仅简单地说一个检测是正确的还是错误的,因此我们使用交并比来评估目标检测性能。在训练过程中,我们会有真实的边界框,这是在训练集中人工标注的真实位置。然后,在模型训练完成后,使用该模型进行预测,得到预测的边界框。如果这两个边界框重叠得很好,那么IoU得分很高,这表示模型性能好。IoU的最大值是1,表示完美匹配。

屏幕截图 2023-09-19 223900.png

精确度表示目标检测模型正确判断图像为正类别的概率,而召回率表示模型能够正确检测出所有正类别的能力。正类别通常用"P"表示,负类别用"N"表示。混淆矩阵用来表示模型的分类结果,包括真正例(TP)、假正例(FP)、真负例(TN)和假负例(FN)。

图片578.png

精确度衡量了模型在标记为正类别的图像中正确预测的比例,而召回率衡量了模型正确检测出的正类别图像占所有正类别图像的比例。


这些指标一起帮助我们评估目标检测模型的性能,特别是在处理正负样本不平衡的情况下。

无论你判断对还是判断错,TP加FN代表所有的正类别。TP表示你正确地找回来的。Recall的数值与精确度类似,介于0到1之间。数值越高,表示你找出所有正类别的能力更强。

图片579.png

此外,还有一个重要的目标检测评估指标,即平均精度值(mAP)。mAP,mean Average Precision即各类别平均精度均值针对每个类别的精度值(P)都被平均,并计算出所有类别的平均AP。每一个类别都可以根据Recall和Precision绘制一条曲线,那么AP就是该曲线下的面积,而mAP则是多个类别AP的平均信,这个值介于0到1之间。mAP是目标检测算法里最重要的一个评估指标。这个值反映了整体的目标检测性能,因为不同类别可能有不同的精度值。这些指标有助于全面评估目标检测模型的性能。

相关文章
|
18天前
|
机器学习/深度学习 数据可视化 计算机视觉
目标检测笔记(五):详细介绍并实现可视化深度学习中每层特征层的网络训练情况
这篇文章详细介绍了如何通过可视化深度学习中每层特征层来理解网络的内部运作,并使用ResNet系列网络作为例子,展示了如何在训练过程中加入代码来绘制和保存特征图。
37 1
目标检测笔记(五):详细介绍并实现可视化深度学习中每层特征层的网络训练情况
|
18天前
|
机器学习/深度学习 编解码 监控
目标检测实战(六): 使用YOLOv8完成对图像的目标检测任务(从数据准备到训练测试部署的完整流程)
这篇文章详细介绍了如何使用YOLOv8进行目标检测任务,包括环境搭建、数据准备、模型训练、验证测试以及模型转换等完整流程。
407 1
目标检测实战(六): 使用YOLOv8完成对图像的目标检测任务(从数据准备到训练测试部署的完整流程)
|
18天前
|
机器学习/深度学习 XML 并行计算
目标检测实战(七): 使用YOLOX完成对图像的目标检测任务(从数据准备到训练测试部署的完整流程)
这篇文章介绍了如何使用YOLOX完成图像目标检测任务的完整流程,包括数据准备、模型训练、验证和测试。
82 0
目标检测实战(七): 使用YOLOX完成对图像的目标检测任务(从数据准备到训练测试部署的完整流程)
|
3月前
|
机器学习/深度学习 监控 算法
目标检测算法技术
8月更文挑战第11天
|
3月前
|
API 异构计算
4.3.2 图像分类ResNet实战:眼疾识别——模型构建
这篇文章介绍了如何使用飞桨框架中的ResNet50模型进行眼疾识别的实战,通过5个epoch的训练,在验证集上达到了约96%的准确率,并提供了模型构建、训练、评估和预测的详细代码实现。
|
6月前
|
机器学习/深度学习 数据可视化 计算机视觉
【YOLOv8改进】MCA:用于图像识别的深度卷积神经网络中的多维协作注意力 (论文笔记+引入代码)
YOLO目标检测专栏介绍了YOLO的创新改进和实战案例,包括多维协作注意力(MCA)机制,它通过三分支架构同时处理通道、高度和宽度注意力,提高CNN性能。MCA设计了自适应组合和门控机制,增强特征表示,且保持轻量化。该模块适用于各种CNN,实验证明其在图像识别任务上的优越性。此外,文章还展示了如何在YOLOv8中引入MCA层的代码实现和相关任务配置。
|
6月前
|
机器学习/深度学习 编解码 监控
【aiy篇】小目标检测综述
【aiy篇】小目标检测综述
124 2
|
机器学习/深度学习 编解码 人工智能
图像分割基础
图像分割基础
184 0
图像分割基础
|
传感器 监控 算法
目标检测基础(二)
目标检测基础(二)
128 0
|
机器学习/深度学习 存储 人工智能
图像分类基础(二)
图像分类基础(二)
120 0