CVPR2022 | Anchor-Free之Label Assignment全新范式,目标检测经典之作!!!(二)

简介: CVPR2022 | Anchor-Free之Label Assignment全新范式,目标检测经典之作!!!(二)

4实验


4.1 消融实验

1、正样本加权的超参数

pos权重有2个超参数:β和µ;

  • β在一致性度量t中平衡了cls得分和IoU之间的贡献。随着β值的增加,IoU的贡献程度也在增加。- µ控制着pos权重的相对尺度。与较不一致的样本相比,更大的µ使最一致的样本具有相对较大的pos权重。

在表中展示了通过改变β从3到7和µ从3到8来改变DW的性能。可以看到,当β为5,µ为5时,效果最好。β和µ的其他组合会使AP性能从0.1降至0.7。因此,在其余所有实验中,将β和µ设为5。

2、负样本加权的超参数

作者还进行了几个实验来研究DW对超参数和的鲁棒性,这些参数用于调节负样本权重的相对尺度。使用不同的和组合得到的AP结果范围为41~41.5,如表所示。这意味着DW的性能对这2个超参数不敏感。因此,在所有的实验中都采用了,。

3、候选集的构建

作为目标检测的常见做法,Soft LA只应用于候选集的Anchor。作者测试了3种候选集的构建方法,它们都是基于从Anchor到相应的GT中心的距离r(由特征stride归一化)。

  • 第1种方法是选择距离小于阈值的Anchor。
  • 第2种方法是从FPN的每个级别中选择最前k个最近的Anchor。
  • 第3种方法是给每个Anchor一个Soft中心权重,并将其与wpos相乘。

结果如表4所示。可以看出,AP性能在41.1~41.5之间略有波动,这表明我们的DW对候选袋的分离方法具有鲁棒性。

4、负样本加权函数的设计

image.png

通过用其他替代方法来研究它的影响,如表所示。可以看到,只使用pos权重会将性能降低到39.5,这表明对于一些低质量的Anchor,只分配它们小的不足以降低它们的Rank分数。它们可以强制以更大的 Rank在后面,在测试期间带来更高的AP。

在不使用或的情况下,分别得到了40.5AP和40.0AP,这验证了这两项都是必要的。正如现有方法所做的,试图用替换实现了40.7AP的性能,比标准DW的低0.8点。

5、Box Refinement

在没有Box Refinement的情况下,DW方法达到41.5AP,这是第1个在不增加FCOS-ResNet-50的情况下,在COCO上实现超过41AP性能的方法。通过Box Refinement,DW可达到42.2AP,如表6所示。表7还显示,Box Refinement可以持续地提高具有不同Backbone的DW的性能。

6、加权策略

为了证明DW策略的有效性,将其与其他使用不同加权策略的LA方法进行了比较。结果如表所示。前5行是Hard LA方法,而其他的则是Soft LA方法。

image.png

Hard LA的最佳性能是通过OTA,40.7AP。由于OTA将LA作为一个最优规划问题,它将增加训练时间的20%以上。GFLv2利用一个额外复杂的分支来估计定位质量,并在Soft LA方法中获得了41.1AP的第2名性能。

与将权重分配给损失的主流方法不同,将自动分配权重分配给cls分数,并在训练期间通过它们的梯度更新它们。作者尝试分离自动分配中的权重并分配给损失,但只得到39.8和36.6AP,分别比原始性能低0.6和3.8分。这意味着自动分配中的加权方案在适应主流实践时不能很好地工作。

4.2 SOTA方法对比

4.3 讨论

1、可视化DW

为了进一步了解DW与现有方法的区别,我们在图5中展示了DW的cls评分、IoU、pos和负性权重以及两种代表性方法GFL和VFL的可视化图。可以看出,DW中的pos和负性权重主要集中在GT的中心区域,而GFL和VFL则在更宽的区域上分配权重。这种差异意味着DW可以更多地关注重要的样本,并减少容易获得的样本的贡献,比如那些在物体边界附近的样本。这就是为什么DW对候选包的选择更稳健。

我们还可以看到,中心区域的锚在DW中有不同的(pos,neg)重量对。相比之下,GFL和VFL中的阴性权重与pos权重高度相关。橙色圆圈突出显示的锚点在GFL和VFL中具有几乎相同的pos权重和负权重,而DW可以通过分配不同的权重来区分它们,为网络提供更高的学习能力。

2、DW的局限

虽然DW可以很好地区分不同Anchor对一个物体的重要性,但它会同时减少训练样本的数量,如图5所示。这可能会影响对小目标的训练效果。如表7所示,DW对小目标的改进不如对大目标的改进高。为了缓解这一问题,作者可以根据目标大小动态设置不同的超参数,以平衡大小目标之间的训练样本。


5参考


[1].A Dual Weighting Label Assignment Scheme for Object Detection


6推荐阅读


Aug-ShuffleNets | ShuffleNetV2参数和FLOPs降低,性能却提升,简单暴力有效!

YOLOv5-Face | 原理超精细讲解、训练步骤还原、C++边缘部署(就要这么学!!!)

YOLOv5-Lite 详解教程 | 嚼碎所有原理、训练自己数据集、TensorRT部署落地应有尽有

即插即用 | S-FPN全新的金字塔网络,更适合轻量化模型的FPN

相关文章
Ubuntu20.04实时显示CPU、内存、网速
Ubuntu20.04实时显示CPU、内存、网速
1728 0
Ubuntu20.04实时显示CPU、内存、网速
|
SQL 存储 NoSQL
CQL基本语法介绍|学习笔记
快速学习CQL:CQL基本语法介绍
CQL基本语法介绍|学习笔记
|
JavaScript 前端开发 API
一文读懂TS的(.d.ts)文件
一文读懂TS的(.d.ts)文件
4466 0
|
自然语言处理 并行计算 算法
cp-sat求解器介绍及使用案例
cp-sat求解器介绍及使用案例 更多文章欢迎关注我的微信公众号:Python学习杂记
3999 1
|
存储 区块链
Swap/dapp去中心化交易所系统开发技术逻辑及源码示例
Swap/DApp去中心化交易所系统开发涉及复杂的去中心化交易模型、智能合约和流动性池技术。智能合约用于资产交换、流动性管理等功能,确保交易的安全性和透明度。以下是一个简化的Swap智能合约源码示例,展示了基本的代币交换功能。
|
缓存 安全 网络安全
|
Linux Shell 开发工具
Git 安装和配置教程:Windows - Mac - Linux 三平台详细图文教程,带你一次性搞 Git 环境
Git是一款免费、开源的分布式版本控制系统,广泛应用于软件开发领域。随着开源和云计算的发展,Git已经成为了开发者必备的工具之一。本文将为大家介绍Git在Windows、Mac和Linux三个平台上的安装和配置方法,带你一次性搞定Git环境
4476 0
|
Shell 数据处理 定位技术
数字孪生核心技术揭秘(二):三维模型
三维模型是一个很宽泛的概念,大部分三维模型是无法直接应用于数字孪生项目的;三维建模需要找专业的供应商进行制作,需要有标准规范和质量检验;建模、模型数据加工都需要制定规范,才能支持好数据融合;需要使用合适的数字孪生引擎才能发挥三维模型的效果;
5096 2
数字孪生核心技术揭秘(二):三维模型
西门子S7-1200的功能与特点,应用范围有哪些
今天开始我们来学习西门子S7-1200,S7-1200是西门子公司新推出的一款面向离散自动化系统和独立自动化系统的低端PLC。
西门子S7-1200的功能与特点,应用范围有哪些
|
存储 监控 算法
2022赛季RoboMaster 空中机器人六轴无人机云台程序框架开源
2022赛季RoboMaster 空中机器人六轴无人机云台程序框架开源
856 0

热门文章

最新文章