目标检测落地技能 | 拥挤目标检测你是如何解决的呢?改进Copy-Paste解决拥挤问题!(二)

简介: 目标检测落地技能 | 拥挤目标检测你是如何解决的呢?改进Copy-Paste解决拥挤问题!(二)

4、Alleviate the Confused De-Duplications


本文的增强策略有一个自然的副产品:对于粘贴的这些重叠目标,相对的“深度顺序”是先验的。换句话说,我们知道哪个在前面,哪个在后面。现在,让我们回到第节中描述的语义歧义。基本上,2D空间中的歧义是由真实(3D)世界中缺少一维造成的。从这个角度来看,深度顺序可以被视为额外第三维度的一些薄弱知识,这有助于减轻模糊性。作为一种可行的实践,在这项工作中利用深度顺序信息来解决混淆的重复数据消除(CDD)问题。

首先,引入一个名为“overlay depth”(OD)的变量,该变量描述了目标在视觉上被其他目标覆盖的程度。图5显示了计算OD的过程。首先假设一个目标的覆盖深度等于1.0,如果没有其他目标覆盖它。设是由目标覆盖的目标的区域,表示区域的大小。对于图像中的任何目标,存在一组覆盖的目标:

image.png

其中,是当前图像中所有目标的集合。然后,可以明确定义的OD值:

image.png

因此,一个物体被其他物体(同一类别的物体)遮挡得越严重,其OD值就越高(如图中的物体b1和b2)。

image.png

从这个特性出发,叠加深度的应用基于一个合理的观察:2个高度重叠的物体通常位于不同的深度,或者更具体地说,具有不同的OD值。因此,通过从深度轴获取额外的知识,可以在混乱的2D平面中进行重复数据消除时采用OD值。

现在,使检测器能够预测OD值。通常,检测模型采用分支来回归边界框的坐标。根据这一设计,为分支添加了一个额外的预测因子,以负责OD回归。该修改导致了可忽略的计算负担,并且可以很容易地在单阶段和两阶段结构中实现。在训练期间,采用了常见的L2损失。应该强调的是,由于覆盖深度的半监督知识,只能获取粘贴对象的OD。因此,只有当GT可用时才激活OD回归损失。从形式上讲,整个损失可以写为:

其中为常规检测损失,为共识学习损失,分别为OD回归损失。在本文中,使用了α = γ = 1和η = 0.1。

在推理过程中提出了一种新的重复数据消除策略,称为Overlay Depth-aware NMS(OD-NMS)。在原始的NMS管道中,bbox被递归地相互比较,如果IoU超过一个阈值,则在每个步骤中其中一个将被抑制。按照这个方案,在拥挤的场景中目标可能会错误地重复数据删除。在OD-NMS中,对于IoU高于阈值的困难情况,将预测的OD值整合到一个更全面的决策中。如果两个目标的深度不同,即两个OD值的绝对差值高于预定义的阈值,可以取消当前步骤中的抑制。根据经验,模糊的情况经常在大的IoU范围内增加:当两个bbox更严重地重叠时,需要更严格的OD阈值来判断它们是否是不同的目标。因此,我们设计了一个基于于单位值的OD的动态阈值:

其中,δ和ψ为常系数。

算法1总结了整个过程。通过这种方式,拥挤场景中的目标可以被有效地召回,而不是不适当地进行重复数据删除。这种策略可以看作是具有相当时间复杂度的原始NMS的演变。


5、实验


5.1、消融实验

1、Crowdedness-oriented Design

2、Consensus Learning

3、Overlay Depth

4、Robustness to Pasting Objects

image.png

5.2、CrowdHuman

image.png

5.3、Results on CityPersons

5.4、Results on KITTI


6、参考


[1].Improving Crowded Object Detection via Copy-Paste.


7、推荐阅读


量化加速系列 | 一文带你对YOLOv5使用PTQ和QAT进行量化加速!!!

多目标跟踪新SOTA | TransTrack改进版本来啦,模型减小58.73%,复杂性降低78.72%

轻量级的CNN模块!RepGhost:重参数化技术构建硬件高效的 Ghost 模块

相关文章
|
3月前
|
机器学习/深度学习 自然语言处理 计算机视觉
YOLOv8改进 | 2023 | 给YOLOv8换个RT-DETR的检测头(重塑目标检测前沿技术)
YOLOv8改进 | 2023 | 给YOLOv8换个RT-DETR的检测头(重塑目标检测前沿技术)
100 0
|
3月前
|
机器学习/深度学习
YOLOv8改进 | 细节创新篇 | iAFF迭代注意力特征融合助力多目标细节涨点
YOLOv8改进 | 细节创新篇 | iAFF迭代注意力特征融合助力多目标细节涨点
69 0
|
16天前
|
机器学习/深度学习 数据可视化 算法
PACNet & CellNet(代码开源)|bulk数据作细胞分类,评估细胞命运性能的一大利器
PACNet和CellNet都是强大的工具,分别用于研究细胞命运工程和细胞类型保真度,它们在细胞类型分类和网络分析方面有所不同,可以根据研究需求选择合适的工具。
26 1
|
5月前
|
自然语言处理 安全 算法
23REPEAT方法:软工顶会ICSE ‘23 大模型在代码智能领域持续学习 代表性样本重放(选择信息丰富且多样化的示例) + 基于可塑权重巩固EWC的自适应参数正则化 【网安AIGC专题11.22】
23REPEAT方法:软工顶会ICSE ‘23 大模型在代码智能领域持续学习 代表性样本重放(选择信息丰富且多样化的示例) + 基于可塑权重巩固EWC的自适应参数正则化 【网安AIGC专题11.22】
78 0
23REPEAT方法:软工顶会ICSE ‘23 大模型在代码智能领域持续学习 代表性样本重放(选择信息丰富且多样化的示例) + 基于可塑权重巩固EWC的自适应参数正则化 【网安AIGC专题11.22】
|
12月前
|
机器学习/深度学习 算法 计算机视觉
目标检测落地技能 | 拥挤目标检测你是如何解决的呢?改进Copy-Paste解决拥挤问题!(一)
目标检测落地技能 | 拥挤目标检测你是如何解决的呢?改进Copy-Paste解决拥挤问题!(一)
184 0
|
12月前
|
机器学习/深度学习 算法 固态存储
其实没有NMS检测也可以很强很快 | O2F样本匹配助力目标检测逃离NMS时代(一)
其实没有NMS检测也可以很强很快 | O2F样本匹配助力目标检测逃离NMS时代(一)
108 0
|
12月前
|
数据可视化 计算机视觉
其实没有NMS检测也可以很强很快 | O2F样本匹配助力目标检测逃离NMS时代(二)
其实没有NMS检测也可以很强很快 | O2F样本匹配助力目标检测逃离NMS时代(二)
161 0
|
12月前
|
机器学习/深度学习 算法 计算机视觉
华为 + 武汉大学提出基于高斯感受野的标签分配 RFLA,大幅度解决超小目标问题!
华为 + 武汉大学提出基于高斯感受野的标签分配 RFLA,大幅度解决超小目标问题!
164 0
|
12月前
|
机器学习/深度学习 编解码 人工智能
AI降维打击人类画家,文生图引入ControlNet,深度、边缘信息全能复用
AI降维打击人类画家,文生图引入ControlNet,深度、边缘信息全能复用
191 0
|
机器学习/深度学习 算法 计算机视觉
基于多注意力融合的抗遮挡目标跟踪算法综述
基于多注意力融合的抗遮挡目标跟踪算法综述
542 0
基于多注意力融合的抗遮挡目标跟踪算法综述