分析单双步目标检测效果差异

简介: 分析单双步目标检测效果差异

前言


  对象检测任务是计算机视觉中极其重要的基础问题。对象检测是检测输入图像中是否存在给定类别的对象,如果是,则输出有关对象在图像中的位置的信息;当图像中存在目标的时候,则输出目标在图像中的位置信息坐标。(这个里面的位置坐标是指bounding box)


  物体检测模型大致可以分为one-stage)模型和two-stage模型两大类。本篇中分析和对比了这两类模型在架构、性能和效率上的差异,并给出了原理解释。



分析理解


单步检测:


  物体检测中的单步模型是指不独立和明确地提取候选区域的模型,并直接从输入图像中获取其中存在的对象的类别和位置信息。(例如:SSD\YOLO)。


双步检测:


  物体识别中的两步模型具有独立、明确的候选区域提取过程,即首先过滤掉输入图像上可能对象的一些候选区域,然后评估每个候选区域是否存在对象,如果存在,则提供对象的类别和位置校正信息。(例如:RCNN\FASTRCNN)



分析


  一般来说,单步模型在计算效率上有优势,两步模型在检测精度上有优 势。如下图所示。可以看到:当检测时间较短时,单步模型 SSD 能 取得更高的精度;而随着检测时间的增加,两步模型 Faster R-CNN 则 在精度上取得优势。对于单步模型与两步模型在速度和精度上的差异,一般认为有如下原因:

      image.png


比较


  1. 大多数单阶段模型使用预设的锚框来捕获可能存在于图像中不同位置的对象。在单步模型中,大量锚点框架根据它们是否包含对象以及对象所属的类别进行密集分类。由于图像中实际包含的对象数远小于锚帧数,因此训练此分类器时正样本和负样本的数量极不均匀,这可能导致分类器训练不佳。由于它包含两步模型中候选区域的独立提取步骤,因此第一步可以过滤掉大多数不包含任何要检测的对象的区域,如果移动第二步来分类和校正候选框的位置和大小,则正负样本的比例相对平衡,并且没有类似的问题。


  2. 两步模型在提取候选区域期间校正候选框的位置和大小,以便在进入第二步之前对齐候选区域的特征,这有助于为第二步的分类提供更高质量的特征。将两阶段模型在第二步的候选箱中再次进行校正,这里共对候选箱进行两次校正,从而带来更高的定位精度,但它也增加了模型的复杂性。单步模型对候选区域没有提取过程,当然也没有特征对齐步骤,每个锚点场的预测都是基于层上每个特征点的接收场,其输入特征不对齐,质量差,因此定位和分类精度容易受到损害。


  3. 以 Faster R-CNN 为代表的两步模型在第二步对候选区域进行分类 和位置回归时,是针对每个候选区域独立进行的,因此该部分的算法复 杂度线性正比于预设的候选区域数目,这往往十分巨大,导致两步模型 的头重脚轻(heavy head)问题。



结束


  以上的分析是分析单双步目标检测效果差异,希望可以帮助大家在项目中对该操作的理解或在面试过程中回答面试官的提问回答。



相关文章
|
7月前
|
机器学习/深度学习 监控 算法
yolov8+多算法多目标追踪+实例分割+目标检测+姿态估计(代码+教程)
yolov8+多算法多目标追踪+实例分割+目标检测+姿态估计(代码+教程)
|
20天前
|
机器学习/深度学习 自然语言处理 C++
TSMamba:基于Mamba架构的高效时间序列预测基础模型
TSMamba通过其创新的架构设计和训练策略,成功解决了传统时间序列预测模型面临的多个关键问题。
67 4
TSMamba:基于Mamba架构的高效时间序列预测基础模型
|
3月前
|
机器学习/深度学习 编解码 测试技术
TimeMOE: 使用稀疏模型实现更大更好的时间序列预测
TimeMOE是一种新型的时间序列预测基础模型,通过稀疏混合专家(MOE)设计,在提高模型能力的同时降低了计算成本。它可以在多种时间尺度上进行预测,并且经过大规模预训练,具备出色的泛化能力。TimeMOE不仅在准确性上超越了现有模型,还在计算效率和灵活性方面表现出色,适用于各种预测任务。该模型已扩展至数十亿参数,展现了时间序列领域的缩放定律。研究结果显示,TimeMOE在多个基准测试中显著优于其他模型,特别是在零样本学习场景下。
459 64
|
5月前
|
机器学习/深度学习 运维 算法
Doping:使用精心设计的合成数据测试和评估异常检测器的技术
在这篇文章中,我们将探讨测试和评估异常检测器的问题(这是一个众所周知的难题),并提出了一种解决方案被称为“Doping”方法。使用Doping方法,真实数据行会被(通常是)随机修改,修改的方式是确保它们在某些方面可能成为异常值,这时应该被异常检测器检测到。然后通过评估检测器检测Doping记录的效果来评估这些检测器。
55 0
|
7月前
|
安全 算法 测试技术
R语言基于copula的贝叶斯分层混合模型的诊断准确性研究
R语言基于copula的贝叶斯分层混合模型的诊断准确性研究
|
7月前
|
数据可视化
R语言实现有限混合模型建模分析
R语言实现有限混合模型建模分析
|
机器学习/深度学习 算法 数据可视化
机器学习-特征选择:如何使用相关性分析精确选择最佳特征?
本文致力于利用相关性分析来辅助特征选择过程。相关性分析作为一种用于量化特征之间关系的方法,可以帮助我们理解数据中的潜在模式和相互作用。通过分析特征之间的相关性,我们可以更加准确地选择具有高预测能力和独立性的特征,从而提高特征选择的效果和结果。
2365 0
|
算法 数据挖掘 计算机视觉
在对比学习中引入显式跨图像相似度建模能力,中南大学显著提高无监督表征的泛化能力(2)
在对比学习中引入显式跨图像相似度建模能力,中南大学显著提高无监督表征的泛化能力
153 0
|
机器学习/深度学习 算法 计算机视觉
在对比学习中引入显式跨图像相似度建模能力,中南大学显著提高无监督表征的泛化能力(1)
在对比学习中引入显式跨图像相似度建模能力,中南大学显著提高无监督表征的泛化能力
160 0
|
机器学习/深度学习 人工智能 监控
基于深度学习的人群密度检测系统(UI界面+YOLOv5+训练数据集)
基于深度学习的人群密度检测系统(UI界面+YOLOv5+训练数据集)
715 0