EQ-Loss V2 | 利用梯度平均进一步缓解目标检测长尾数据分布问题(附论文下载)

简介: EQ-Loss V2 | 利用梯度平均进一步缓解目标检测长尾数据分布问题(附论文下载)

1.简介


最近提出的解耦训练方法成为长尾目标检测的主要范式。但是它们需要一个额外的微调阶段,并且表示和分类器的脱节优化可能导致次优结果。但是,端到端的训练方法,例如均衡损失(EQL),仍然比解耦的训练方法更差。

上图观察结果梯度的幅度相近;尾部类别的梯度接近于0,说明正梯度被负梯度所淹没。因此梯度比可以指示分类器是否经过平衡训练。与基线(蓝色线)相比,EQL(橙色线)的梯度比率只是略有增加。

本文揭示了长尾目标检测中的主要问题是正负之间的梯度不平衡,并且发现EQL不能很好地解决它。为了解决梯度不平衡的问题,本文引入了一种新版本的均衡损失,称为Equalization Loss v2(EQL v2),这是一种新颖的梯度引导Re-Weighing机制,可以独立且均等地重新平衡每个类别的训练过程。

在具有挑战性的LVIS基准上进行了广泛的实验。EQL v2在整体AP方面比原始EQL高出约4个百分点,在稀有类别上提高了14-18个百分点。更重要的是,它还超越了分离训练方法。EQL v2无需进一步调整Open Images数据集,便将EQL提高了6.3个点的AP,显示了其强大的泛化能力。


2.相关工作


2.1 通用目标检测

当前性能比较好的目标检测框架主要依赖于卷积神经网络(CNN)的支持。它们可以分为基于区域的检测器和基于Anchor的检测器。然而,这些框架都是在数据平衡的条件下发展起来的。在数据的长尾分布时,由于类别间的不平衡,性能会严重下降。

2.2 Long-tailed图像分类

我们都知道,传统针对Long-tailed图像分类使用的要么是数据Re-Sample、要么是损失Re-Weighted的方法;但是,数据重采样必须预先计算的数据分布统计,可能存在尾类过拟合和头类欠拟合的风险。同时损失Re-Weighted受到敏感超参数的影响,不同数据集的最佳设置可能差异很大,需要花费很大的精力才能找到相对合适的权重。

也有一些工作试图把Knowledge从头类转移到尾类。OLTR设计了一个内存模块来增加tail类的功能。有研究者通过在特征迁移head类中学习到的知识,然后在特征空间中扩充未充分表示的类。最近,解耦训练模式也引起了人们的广泛关注。他们认为,不需要重新采样就可以学习通用表示,分类器应该在冻结表示的第2微调阶段重新平衡。尽管有很好的结果,额外的微调阶段似乎略显冗余,为什么表示和分类器必须分开学习呢???

2.3 Long-tailed目标检测

相较于前面所说的Long-tailed图像分类,Long-tailed目标检测是一个更具挑战性的任务,它必须在每个可能的位置找到所有不同尺度的目标对象。

Li等人通过实验和实践的经验发现,针对长尾图像分类的方法在目标检测中并不能取得良好的效果。Tan等人也证明了尾部类受到头部类的严重抑制,并提出了一种均衡损失的方法来解决这一问题,忽略尾部类的抑制部分。然而,他们认为负面抑制来自于前景类目的竞争,忽略了背景提案的影响。

而EQL方法必须访问类别的频率,并使用阈值函数显式地分割头部和尾部类别。LST方法则是将长尾分布的学习模型作为一种增量式学习,学习在几个级联阶段从头类切换到尾类。

SimCal方法和Balanced GroupSoftmax方法则遵循解耦训练的思想。BAGS则是根据实例数将所有类别划分为几个组,并在每个组中单独执行softmax操作,以避免head类占据主导地位。

相比之下,本文的方法不需要将类别划分为不同的组,并平等对待所有类别。此外,也不需要微调阶段,可以端到端训练。同时保持了训练与推理之间的一致性。


3.Equalization Loss v2


3.1 实例和任务的纠缠

假设有一批实例和它们的表征。为了输出类的,使用权重矩阵作为表征的线性变换。中的每个权重向量称之为类别分类器,它负责一个特定的类别,即一个任务Task。然后利用sigmoid函数将输出日志转换为估计的概率分布P。期望对于每个实例只有相应的分类器给出高分,而其他分类器给出低分。也就是说,一个带有正号标签的任务和一个带有负号标签的c1任务由一个实例引入。因此,可以计算分类器的实际正样本和负样本的个数

image.png

其中是第个实例Groud Truth的One-Hot编码,通常有。则数据集上正样本与负样本的期望之比为:

image.png

其中,是类别的实例数,是数据集上的总实例数。上式表明,如果单独考虑每个分类器,对于不同的分类器阳性样本与阴性样本的比例可能会有很大的差异。

3.2 梯度引导Reweighing

显然,当时,类便是一个罕见的类。但是,公式2中的比率可能并不能很好地指示训练的平衡程度。这背后的原因是每个样本的影响是不同的。

例如,大量负面影响所积累的负梯度可能比一些正面影响所产生的正梯度要小。因此,可以直接选择梯度统计量作为衡量一个任务是否处于均衡训练状态的指标。每个分类器的输出相对于损失的正梯度和负梯度表达式为:

image.png

其中,是第个情况下第类的估计概率。

梯度引导Reweighing的基本思想是:根据分类器正梯度与负梯度的累积梯度比,分别对每个分类器的正梯度和负梯度进行加权。为此,先定义为任务的累计正梯度与负梯度的比值,直到迭代。然后在此迭代中,正梯度和负梯度的权重可计算如下:

image.png

其中,是映射函数:

image.png

得到正梯度和负梯度,然后将它们分别应用于当前批次的正梯度和负梯度,重新加权后的梯度为:

image.png

最后为下一个迭代更新累积的正梯度与负梯度的比率:

image.png

3.3 Category-Agnostic任务

本文还增加了一个检测客观性的分支,不是具体的类别,以减少虚假,称之为类别不可知论任务。在训练阶段,本任务将所有其他任务的正样本视为自己的正样本。在推理阶段,其他子任务的估计概率为:

image.png

其中是建议为目标对象的概率。


4. 实验


image.png

总之,在这项工作中提出了提高长尾目标检测性能的关键是保持正负梯度之间的平衡。然后提出EQL的改进版本EQL v2,以动态平衡训练阶段的正负梯度比率。它带来了巨大的改进,显著增强了跨各种框架的尾部类别。作为一种端到端的训练方法,它在具有挑战性的LVIS基准上击败了所有现有的方法,包括占主导地位的解耦训练模式。


5. 参考


[1].Equalization Loss v2:A New Gradient Balance Approach for Long-tailed Object Detection


相关文章
|
6月前
|
算法 固态存储 计算机视觉
Focaler-IoU开源 | 高于SIoU+关注困难样本,让YOLOv5再涨1.9%,YOLOv8再涨点0.3%
Focaler-IoU开源 | 高于SIoU+关注困难样本,让YOLOv5再涨1.9%,YOLOv8再涨点0.3%
247 0
|
4月前
|
机器学习/深度学习 索引 Python
。这不仅可以减少过拟合的风险,还可以提高模型的准确性、降低计算成本,并帮助理解数据背后的真正含义。`sklearn.feature_selection`模块提供了多种特征选择方法,其中`SelectKBest`是一个元变换器,可以与任何评分函数一起使用来选择数据集中K个最好的特征。
。这不仅可以减少过拟合的风险,还可以提高模型的准确性、降低计算成本,并帮助理解数据背后的真正含义。`sklearn.feature_selection`模块提供了多种特征选择方法,其中`SelectKBest`是一个元变换器,可以与任何评分函数一起使用来选择数据集中K个最好的特征。
|
6月前
|
前端开发
数据分享|R语言零膨胀泊松回归ZERO-INFLATED POISSON(ZIP)模型分析露营钓鱼数据实例估计IRR和OR
数据分享|R语言零膨胀泊松回归ZERO-INFLATED POISSON(ZIP)模型分析露营钓鱼数据实例估计IRR和OR
|
6月前
|
机器学习/深度学习 数据采集 算法
ARMA-EGARCH模型、集成预测算法对SPX实际波动率进行预测
ARMA-EGARCH模型、集成预测算法对SPX实际波动率进行预测
|
6月前
|
机器学习/深度学习 数据采集 算法
R语言ARMA-EGARCH模型、集成预测算法对SPX实际波动率进行预测
R语言ARMA-EGARCH模型、集成预测算法对SPX实际波动率进行预测
|
6月前
|
算法 数据挖掘
WinBUGS对多元随机波动率模型:贝叶斯估计与模型比较
WinBUGS对多元随机波动率模型:贝叶斯估计与模型比较
|
6月前
|
机器学习/深度学习 数据可视化 算法
R语言多分类logistic逻辑回归模型在混合分布模拟单个风险损失值评估的应用
R语言多分类logistic逻辑回归模型在混合分布模拟单个风险损失值评估的应用
|
数据可视化 计算机视觉
深入了解平均精度(mAP):通过精确率-召回率曲线评估目标检测性能
平均精度(Average Precision,mAP)是一种常用的用于评估目标检测模型性能的指标。在目标检测任务中,模型需要识别图像中的不同目标,并返回它们的边界框(bounding box)和类别。mAP用于综合考虑模型在不同类别上的准确度和召回率。
1031 0
|
数据可视化
探索不同学习率对训练精度和Loss的影响
探索不同学习率对训练精度和Loss的影响
274 0
|
算法 计算机视觉
再战IOU | 总结分析IOU/GIOU/CIOU局限,提出Focal EIOU进一步提升目标检测性能(一)
再战IOU | 总结分析IOU/GIOU/CIOU局限,提出Focal EIOU进一步提升目标检测性能(一)
299 0
下一篇
无影云桌面