目标检测落地技能 | 拥挤目标检测你是如何解决的呢?改进Copy-Paste解决拥挤问题!(二)

简介: 目标检测落地技能 | 拥挤目标检测你是如何解决的呢?改进Copy-Paste解决拥挤问题!(二)

4、Alleviate the Confused De-Duplications


本文的增强策略有一个自然的副产品:对于粘贴的这些重叠目标,相对的“深度顺序”是先验的。换句话说,我们知道哪个在前面,哪个在后面。现在,让我们回到第节中描述的语义歧义。基本上,2D空间中的歧义是由真实(3D)世界中缺少一维造成的。从这个角度来看,深度顺序可以被视为额外第三维度的一些薄弱知识,这有助于减轻模糊性。作为一种可行的实践,在这项工作中利用深度顺序信息来解决混淆的重复数据消除(CDD)问题。

首先,引入一个名为“overlay depth”(OD)的变量,该变量描述了目标在视觉上被其他目标覆盖的程度。图5显示了计算OD的过程。首先假设一个目标的覆盖深度等于1.0,如果没有其他目标覆盖它。设是由目标覆盖的目标的区域,表示区域的大小。对于图像中的任何目标,存在一组覆盖的目标:

image.png

其中,是当前图像中所有目标的集合。然后,可以明确定义的OD值:

image.png

因此,一个物体被其他物体(同一类别的物体)遮挡得越严重,其OD值就越高(如图中的物体b1和b2)。

image.png

从这个特性出发,叠加深度的应用基于一个合理的观察:2个高度重叠的物体通常位于不同的深度,或者更具体地说,具有不同的OD值。因此,通过从深度轴获取额外的知识,可以在混乱的2D平面中进行重复数据消除时采用OD值。

现在,使检测器能够预测OD值。通常,检测模型采用分支来回归边界框的坐标。根据这一设计,为分支添加了一个额外的预测因子,以负责OD回归。该修改导致了可忽略的计算负担,并且可以很容易地在单阶段和两阶段结构中实现。在训练期间,采用了常见的L2损失。应该强调的是,由于覆盖深度的半监督知识,只能获取粘贴对象的OD。因此,只有当GT可用时才激活OD回归损失。从形式上讲,整个损失可以写为:

其中为常规检测损失,为共识学习损失,分别为OD回归损失。在本文中,使用了α = γ = 1和η = 0.1。

在推理过程中提出了一种新的重复数据消除策略,称为Overlay Depth-aware NMS(OD-NMS)。在原始的NMS管道中,bbox被递归地相互比较,如果IoU超过一个阈值,则在每个步骤中其中一个将被抑制。按照这个方案,在拥挤的场景中目标可能会错误地重复数据删除。在OD-NMS中,对于IoU高于阈值的困难情况,将预测的OD值整合到一个更全面的决策中。如果两个目标的深度不同,即两个OD值的绝对差值高于预定义的阈值,可以取消当前步骤中的抑制。根据经验,模糊的情况经常在大的IoU范围内增加:当两个bbox更严重地重叠时,需要更严格的OD阈值来判断它们是否是不同的目标。因此,我们设计了一个基于于单位值的OD的动态阈值:

其中,δ和ψ为常系数。

算法1总结了整个过程。通过这种方式,拥挤场景中的目标可以被有效地召回,而不是不适当地进行重复数据删除。这种策略可以看作是具有相当时间复杂度的原始NMS的演变。


5、实验


5.1、消融实验

1、Crowdedness-oriented Design

2、Consensus Learning

3、Overlay Depth

4、Robustness to Pasting Objects

image.png

5.2、CrowdHuman

image.png

5.3、Results on CityPersons

5.4、Results on KITTI


6、参考


[1].Improving Crowded Object Detection via Copy-Paste.


7、推荐阅读


量化加速系列 | 一文带你对YOLOv5使用PTQ和QAT进行量化加速!!!

多目标跟踪新SOTA | TransTrack改进版本来啦,模型减小58.73%,复杂性降低78.72%

轻量级的CNN模块!RepGhost:重参数化技术构建硬件高效的 Ghost 模块

相关文章
|
Ubuntu 安全 Linux
Linux(34)Rockchip RK3568 Ubuntu22.04和Debian 10上配置远程桌面工具
Linux(34)Rockchip RK3568 Ubuntu22.04和Debian 10上配置远程桌面工具
1641 0
Rockchip系列之LED状态灯 串口收发数据流程以及控制状态显示(3)
Rockchip系列之LED状态灯 串口收发数据流程以及控制状态显示(3)
416 0
|
网络协议 前端开发 JavaScript
CentOS 环境下部署 vsftpd
CentOS 环境下部署 vsftpd
401 0
|
9月前
|
机器学习/深度学习 数据可视化 算法
YOLOv9改进目录一览 | 涉及卷积层、轻量化、注意力、损失函数、Backbone、SPPF、Neck、检测头等全方位改进
YOLOv9改进目录一览 | 涉及卷积层、轻量化、注意力、损失函数、Backbone、SPPF、Neck、检测头等全方位改进
773 5
YOLOv9改进目录一览 | 涉及卷积层、轻量化、注意力、损失函数、Backbone、SPPF、Neck、检测头等全方位改进
|
Python
pip安装包报错Could not find a version that satisfies the requirement pymysql (from versions: none)
pip安装包报错Could not find a version that satisfies the requirement pymysql (from versions: none)
1255 1
|
机器学习/深度学习 人工智能 自然语言处理
【AI大模型】BERT模型:揭秘LLM主要类别架构(上)
【AI大模型】BERT模型:揭秘LLM主要类别架构(上)
1203 1
|
存储 运维 监控
深入Linux核心:文件系统与日志解析
【8月更文挑战第20天】
270 2
|
Python
【已解决】如何用正则提取小括号的内容
【已解决】如何用正则提取小括号的内容
376 0
|
机器学习/深度学习 编解码 算法
【论文解析】CFPNet:用于目标检测的集中特征金字塔
【论文解析】CFPNet:用于目标检测的集中特征金字塔
803 0
【论文解析】CFPNet:用于目标检测的集中特征金字塔