3、Loss Settings based on IOU
3.1、IOU branch
分类和回归任务相对独立,分类置信度不能准确地表示预测框的位置。因此,NMS会过滤一些更准确的预测框。作者使用一种成本较低的独立于类别的方法,对NMS中使用的分数进行基于IOU的衰减。
如图6所示,添加了一个分支来预测回归框和它们的GT之间的IOU。结果是通过在增强的特征图上直接应用3×3卷积,然后使用sigmoid函数将其归一化为0-1得到的。计算回归框与GT之间的IOU。
为了确保损失的凸性并增加梯度值,设计了一种新的IOU回归损失(),如下所示:
其中是预测的并集上的交集,是并集上目标交集,分别是IOU和目标IOU的精度。
3.2、Regression Loss
为了使大目标更好地回归,使用由Libra-RCNN提出的balance ():
其中,默认参数设置为α=0.5和γ=1.5。
3.3、Cross-entropy of joint IOU loss:
对于一般的单阶段检测算法,如RetinaNet,IOU在0.4-0.5范围内的样本被忽略,因为模型很难学习分类边界。然而,仍然存在以下问题:
- 存在一些假阳性样本(回归结果的IOU小于0.5),模型仍然迫使它们被识别为吗,这导致低质量预测框。
- 有些样本的IOU在0.4-0.5之间,可以学习,忽略这些样本不利于提高模型的学习能力。
- 传统的交叉熵损失没有考虑推理过程中NMS中使用的分数生成。
因此,采用了新的正样本规则,并设计了一个新的联合IOU()交叉熵损失,如下所示:
其中是梯度值,是预测类概率。将其GT值大于0.4的IOU的默认框设置为正样本。如果可以更准确地回归默认框(≥ 0.5),计算分类损失,否则忽略它们。
因此,该模型不强制对假阳性样本进行分类,可以挖掘出更多潜在的阳性样本。同时,将最终优化目标更改为最大化·,这与推断一致(得分=·)。此外,考虑到平衡未从回归的整体进行优化该损失函数可以将关于IOU的监测信号添加到回归器,以使预测结果更加准确。
4、实验
4.1、Performance evaluation on Microsoft COCO
4.2、Ablation Study
4.3、FEM module
4.4、Performance evaluation on Pascal VOC 2007
5、参考
[1].Precise Single-stage Detector.
6、推荐阅读
全新语义分割方法SegViT | 沈春华老师团队提出全新语义分割方法