TPAMI 2024:ProCo: 无限contrastive pairs的长尾对比学习

简介: 【8月更文挑战第17天】在深度学习领域,长尾分布问题困扰着视觉识别任务。针对监督对比学习(SCL)在长尾数据中受限于批量大小的问题,清华大学的研究者在TPAMI 2024发表了一种概率对比学习方法ProCo。ProCo通过估计特征空间中的样本分布,允许在小批量数据中高效构建对比对,采用vMF混合模型简化分布估计,实现无限对比对的采样和封闭形式的对比损失,有效解决了SCL的固有问题。此方法不仅提升了长尾类别的识别精度,还适用于半监督学习场景。尽管存在假设限制和超参数调整需求,ProCo在多种任务和数据集上展示了显著的性能提升。

在深度学习领域,长尾分布问题一直是视觉识别任务中的一个难题。长尾分布指的是在现实世界的数据集中,少数类别拥有大量样本,而大多数类别只有少量样本,形成一种从“头”到“尾”样本数量指数级递减的不平衡分布。这种不平衡的数据分布对标准的监督学习算法构成了挑战,因为这些算法主要是为平衡的数据集设计的。近年来,监督对比学习(Supervised Contrastive Learning, SCL)因其在缓解数据不平衡方面的潜力而受到关注。然而,SCL的性能受限于其需要足够大的批量数据来构建涵盖所有类别的对比对,这在类别不平衡的数据中难以实现。

针对这一问题,清华大学的Chaoqun Du、Yulin Wang、Shiji Song和Gao Huang在IEEE TPAMI 2024年的一篇论文中提出了一种新颖的概率对比学习方法——ProCo(Probabilistic Contrastive Learning)。ProCo算法的核心思想是通过估计每个类别在特征空间中的样本数据分布,并据此采样对比对。ProCo算法的提出,旨在解决SCL在处理长尾分布数据时对大批量数据的依赖性,通过引入von Mises-Fisher(vMF)分布的混合模型来估计特征分布,从而允许在小批量数据中高效地估计所有类别的分布参数。

ProCo算法的提出,是对现有对比学习技术的一次重要补充。它通过简化的假设——即对比学习中的归一化特征遵循单位空间上的vMF分布——实现了两个主要优势:首先,可以通过仅使用第一阶样本矩来估计分布参数,这可以在不同批次中高效地在线计算;其次,基于估计的分布,vMF分布允许我们采样无限数量的对比对,并导出期望对比损失的封闭形式,从而实现高效优化。

ProCo算法不仅适用于长尾问题,还可以直接应用于半监督学习,通过为未标记数据生成伪标签,进而用于估计样本的分布。理论上,论文对ProCo的误差界限进行了分析,并通过在监督/半监督视觉识别和目标检测任务上的广泛实验结果证明了ProCo在多个数据集上持续超越现有方法的性能。

然而,ProCo算法也有其局限性。首先,ProCo依赖于vMF分布的假设,这可能不适用于所有类型的数据分布。此外,ProCo算法在实际应用中可能需要调整多个超参数以适应不同的数据集和任务,这可能会增加模型训练的复杂性。尽管如此,ProCo算法在处理长尾分布问题上展现出的潜力和效果是值得肯定的。

论文的实验部分对ProCo算法进行了深入的评估。作者在多个长尾和平衡数据集上进行了实验,包括CIFAR10/100-LT、ImageNet-LT、iNaturalist 2018和LVIS v1。实验结果表明,ProCo在各种情况下都能有效地提高模型的泛化性能,尤其是在长尾类别上。此外,ProCo算法在半监督学习任务中也显示出了良好的性能,证明了其在现实世界不平衡数据集中的应用潜力。

论文链接: https://arxiv.org/pdf/2403.06726

目录
相关文章
|
机器学习/深度学习
"独家揭秘TPAMI 2024神作:ProCo魔法降临,无限对比对撞长尾困境,革命性学习浪潮来袭!"
【8月更文挑战第19天】《ProCo: 无限对比对的长尾对比学习》近期登上TPAMI 2024。针对现实世界图像数据中的长尾分布问题,该方法通过构建原型网络并生成无限对比对来增强模型学习,设计了新颖的对比损失函数及优化策略,显著提升了长尾识别准确性。实验显示,在CIFAR-10-LT等数据集上,ProCo方法的Acc@1达47.3%,优于现有技术。示例代码展示了模型训练流程,有助于快速上手实践。此成果有望推动长尾视觉识别领域的进一步发展。
294 2
CCF推荐A类会议和期刊总结:计算机体系结构/并行与分布计算/存储系统领域
中国计算机学会(CCF)2022年版推荐目录涵盖了计算机体系结构、并行与分布计算、存储系统领域的多个A类会议和期刊。本文汇总了这些顶级资源的全称、出版社、dblp网址及领域。包括《ACM计算机系统汇刊》、《ACM存储汇刊》等期刊,以及ACM PPoPP、USENIX FAST等会议,为研究人员提供了重要学术参考。
12750 64
CCF推荐A类会议和期刊总结:计算机体系结构/并行与分布计算/存储系统领域
|
12月前
|
机器学习/深度学习
ProCo: 无限contrastive pairs的长尾对比学习——TPAMI 2024最新成果解读
【10月更文挑战第3天】《ProCo: Infinite Contrastive Pairs for Long-Tailed Contrastive Learning》是TPAMI 2024的最新成果,针对现实世界图像数据中的长尾分布问题,提出了一种通过生成无限对比对来提升模型效果的方法。ProCo包括构建原型网络、生成对比对、设计对比损失函数及优化策略。实验结果显示,ProCo在多个长尾数据集上显著优于现有方法。此外,还提供了简化版示例代码,便于读者理解和应用。未来,该领域有望涌现更多创新研究。
276 3
|
机器学习/深度学习 并行计算 PyTorch
从零开始下载torch+cu(无痛版)
这篇文章提供了一个详细的无痛版教程,指导如何从零开始下载并配置支持CUDA的PyTorch GPU版本,包括查看Cuda版本、在官网检索下载包名、下载指定的torch、torchvision、torchaudio库,并在深度学习环境中安装和测试是否成功。
从零开始下载torch+cu(无痛版)
|
机器学习/深度学习 PyTorch 算法框架/工具
数据平衡与采样:使用 DataLoader 解决类别不平衡问题
【8月更文第29天】在机器学习项目中,类别不平衡问题非常常见,特别是在二分类或多分类任务中。当数据集中某个类别的样本远少于其他类别时,模型可能会偏向于预测样本数较多的类别,导致少数类别的预测性能较差。为了解决这个问题,可以采用不同的策略来平衡数据集,包括过采样(oversampling)、欠采样(undersampling)以及合成样本生成等方法。本文将介绍如何利用 PyTorch 的 `DataLoader` 来处理类别不平衡问题,并给出具体的代码示例。
2513 2
|
机器学习/深度学习 搜索推荐 算法
混合推荐系统
混合推荐系统
|
编解码 IDE 开发工具
【Matplotlib】figure方法 你真的会了吗!?
【Matplotlib】figure方法 你真的会了吗!?
659 1
|
算法 Go vr&ar
YOLOv8模型yaml结构图理解(逐层分析)
YOLOv8模型yaml结构图理解(逐层分析)
16971 0
|
存储 数据安全/隐私保护 iOS开发