TPAMI 2024：ProCo: 无限contrastive pairs的长尾对比学习-阿里云开发者社区

TPAMI 2024：ProCo: 无限contrastive pairs的长尾对比学习

2024-08-17 217

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 【8月更文挑战第17天】在深度学习领域，长尾分布问题困扰着视觉识别任务。针对监督对比学习（SCL）在长尾数据中受限于批量大小的问题，清华大学的研究者在TPAMI 2024发表了一种概率对比学习方法ProCo。ProCo通过估计特征空间中的样本分布，允许在小批量数据中高效构建对比对，采用vMF混合模型简化分布估计，实现无限对比对的采样和封闭形式的对比损失，有效解决了SCL的固有问题。此方法不仅提升了长尾类别的识别精度，还适用于半监督学习场景。尽管存在假设限制和超参数调整需求，ProCo在多种任务和数据集上展示了显著的性能提升。

在深度学习领域，长尾分布问题一直是视觉识别任务中的一个难题。长尾分布指的是在现实世界的数据集中，少数类别拥有大量样本，而大多数类别只有少量样本，形成一种从“头”到“尾”样本数量指数级递减的不平衡分布。这种不平衡的数据分布对标准的监督学习算法构成了挑战，因为这些算法主要是为平衡的数据集设计的。近年来，监督对比学习（Supervised Contrastive Learning, SCL）因其在缓解数据不平衡方面的潜力而受到关注。然而，SCL的性能受限于其需要足够大的批量数据来构建涵盖所有类别的对比对，这在类别不平衡的数据中难以实现。

针对这一问题，清华大学的Chaoqun Du、Yulin Wang、Shiji Song和Gao Huang在IEEE TPAMI 2024年的一篇论文中提出了一种新颖的概率对比学习方法——ProCo（Probabilistic Contrastive Learning）。ProCo算法的核心思想是通过估计每个类别在特征空间中的样本数据分布，并据此采样对比对。ProCo算法的提出，旨在解决SCL在处理长尾分布数据时对大批量数据的依赖性，通过引入von Mises-Fisher（vMF）分布的混合模型来估计特征分布，从而允许在小批量数据中高效地估计所有类别的分布参数。

ProCo算法的提出，是对现有对比学习技术的一次重要补充。它通过简化的假设——即对比学习中的归一化特征遵循单位空间上的vMF分布——实现了两个主要优势：首先，可以通过仅使用第一阶样本矩来估计分布参数，这可以在不同批次中高效地在线计算；其次，基于估计的分布，vMF分布允许我们采样无限数量的对比对，并导出期望对比损失的封闭形式，从而实现高效优化。

ProCo算法不仅适用于长尾问题，还可以直接应用于半监督学习，通过为未标记数据生成伪标签，进而用于估计样本的分布。理论上，论文对ProCo的误差界限进行了分析，并通过在监督/半监督视觉识别和目标检测任务上的广泛实验结果证明了ProCo在多个数据集上持续超越现有方法的性能。

然而，ProCo算法也有其局限性。首先，ProCo依赖于vMF分布的假设，这可能不适用于所有类型的数据分布。此外，ProCo算法在实际应用中可能需要调整多个超参数以适应不同的数据集和任务，这可能会增加模型训练的复杂性。尽管如此，ProCo算法在处理长尾分布问题上展现出的潜力和效果是值得肯定的。

论文的实验部分对ProCo算法进行了深入的评估。作者在多个长尾和平衡数据集上进行了实验，包括CIFAR10/100-LT、ImageNet-LT、iNaturalist 2018和LVIS v1。实验结果表明，ProCo在各种情况下都能有效地提高模型的泛化性能，尤其是在长尾类别上。此外，ProCo算法在半监督学习任务中也显示出了良好的性能，证明了其在现实世界不平衡数据集中的应用潜力。

论文链接: https://arxiv.org/pdf/2403.06726

TPAMI 2024：ProCo: 无限contrastive pairs的长尾对比学习

热门文章

最新文章

相关电子书

热门

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

TPAMI 2024：ProCo: 无限contrastive pairs的长尾对比学习

热门文章

最新文章

相关电子书