【论文速递】ECCV2022 - 开销聚合与四维卷积Swin Transformer_小样本分割

简介: 【论文速递】ECCV2022 - 开销聚合与四维卷积Swin Transformer_小样本分割

【论文速递】ECCV2022 - 开销聚合与四维卷积Swin Transformer_小样本分割

【论文原文】:Cost Aggregation with 4D Convolutional Swin Transformer for Few-Shot Segmentation

获取地址:https://arxiv.org/pdf/2207.10866.pdf

博主关键词: 小样本学习,语义分割,Transformer,聚合

推荐相关论文:

【论文速递】CVPR2022 - 学习 什么不能分割:小样本分割的新视角
- https://blog.csdn.net/qq_36396104/article/details/128658168

摘要:

本文提出了一种新的开销聚合网络,称为体积聚合Transformer(VAT),用于小样本分割。Transformer的使用可以通过对全局接受域的自注意力而有利于相关映射聚合。但是,用于Transformer处理的相关映射的标记化可能是有害的,因为标记边界上的不连续减少了标记边缘附近可用的本地上下文,并减少了归纳偏差。 为了解决这个问题,我们提出了一个4D卷积Swin Transformer ,其中高维Swin Transformer之前是一系列小核卷积,将局部上下文传递给所有像素,并引入卷积归纳偏差。我们还通过在金字塔结构中应用transformers来提高聚合性能 ,在金字塔结构中,较粗级别的聚合引导较细级别的聚合。然后,在查询的外观嵌入的帮助下,在后续的解码器中过滤变压器输出中的噪声。有了这个模型,一种新的最先进的技术在小样本分割被设置为所有的标准基准。结果表明,VAT在语义对应方面也达到了最先进的性能,其中开销聚合也起着核心作用。代码和训练过的模型可以在https://seokju-cho.github.io/VAT/上找到。

简介:

语义分割是一项基本的计算机视觉任务,旨在为图像中的每个像素标记相应的类。在深度神经网络和包含ground-truth分割注释的大规模数据集的帮助下,这一方向已经取得了实质性进展[37,46,3,4,61]。然而,手动标记按像素划分的地图需要大量的劳动,因此很难添加新的类。为了减少对标记数据的依赖,人们越来越关注小样本分割[49,55],其中只有少数支持图像及其相关掩码被用于预测查询图像的分割。

Fig. 1. 我们的VAT重新制定小样本分割为语义对应。VAT在小样本分割方面达到了最新水平,在语义对应方面也达到了最新水平。

小样本分割的关键是有效利用少的支持样本。许多工作尝试从样本中提取原型模型,并将其用于与查询的特征比较[58,10,35,78]。然而,这种方法忽略了支持特征和查询特征之间像素级的成对关系或特征的空间结构,可能会导致次优结果。

为了解释这种关系,我们观察到,小样本分割可以重新表述为语义对应,其目的是在语义相似的图像之间找到像素级对应,这些图像可能包含大量的类内外观和几何变化[13,14,43]。 最近的语义对应模型[50,25,51,53,42,44,34,65,41]遵循了特征提取、开销聚合和流量估计的经典匹配管道[54,47]。在开销聚合阶段,匹配分数被细化以产生更可靠的对应估计,这是特别重要的,也是许多研究的焦点[53,42,52,22,34,29,41,6]。最近CATs[6]提出使用视觉transformers[11]进行开销聚合,但其对输入令牌数量的二次复杂度限制了其适用性。它还忽视了匹配成本的空间结构,这可能会损害其绩效。

在小样本分割领域,也有一些方法试图通过交叉注意(cross-attention)[83]或图注意(graph attention)[81,68,75]来精炼特征,从而利用成对信息。然而,它们只依赖原始相关图,而不聚合匹配分数。因此,它们的对应可能会因重复的模式或背景杂散而产生歧义[50,25,27,65,17]。为了解决这个问题,HSNet[40]使用4D卷积聚合匹配分数,但其有限的接受字段阻止了远程上下文聚合,并且由于使用固定内核而缺乏适应输入内容的能力。

在本文中,我们介绍了一种新的开销聚合网络,称为Volumetric aggregation with Transformer (VAT),它通过提出的4D卷积Swin Transformer解决了小样本分割任务。 具体来说,我们首先扩展Swin Transformer[36]及其补丁嵌入模块,以处理高维相关映射。通过引入4D卷积来进一步扩展补丁嵌入模块,缓解了补丁嵌入引起的问题,即补丁边界附近有限的局部上下文和低归纳偏差。高维补丁嵌入模块被设计为一系列重叠的小核卷积,为每个像素带来局部上下文信息,并赋予卷积归纳偏差。为了进一步提高性能,我们使用金字塔结构组合我们的体系结构,该结构将较粗级别上的聚合相关映射作为较细级别上的额外输入,从而提供分层指导。然后,我们的亲和感知解码器以一种利用查询外观嵌入给出的更高分辨率空间结构的方式细化聚合匹配分数,并最终输出分割掩码预测。

我们在几个基准上证明了该方法的有效性[55,31,30]。我们的工作在所有的基准上都达到了最先进的性能,用于few-shot分割,甚至用于语义对应,突出了开销聚合对这两个任务的重要性,并显示了其一般匹配的潜力。我们还包括消融研究,以证明我们的设计选择。

Fig. 2. 整体网络架构。我们的网络包括特征提取和开销计算,一个金字塔式transformer编码器和一个亲和感知transformer解码器。

【社区访问】

【论文速递 | 精选】

阅读原文访问社区

https://bbs.csdn.net/forums/paper


AIEarth是一个由众多领域内专家博主共同打造的学术平台,旨在建设一个拥抱智慧未来的学术殿堂!【平台地址:https://devpress.csdn.net/aiearth】 很高兴认识你!加入我们共同进步!

目录
相关文章
|
机器学习/深度学习 数据可视化 PyTorch
【PyTorch】TensorBoard基本使用
【PyTorch】TensorBoard基本使用
1068 0
|
人工智能 并行计算 PyTorch
AI计算机视觉笔记十八:Swin Transformer目标检测环境搭建
本文详细记录了Swin Transformer在AutoDL平台上的环境搭建与训练过程。作者从租用GPU实例开始,逐步介绍了虚拟环境的创建、PyTorch安装、mmcv及mmdetection的配置,并解决了安装过程中遇到的各种问题,如cython版本冲突等。最后,通过修改代码实现目标检测结果的保存。如需了解更多细节或获取完整代码,请联系作者。原文链接:[原文链接](请在此处插入原文链接)。
1131 5
|
8月前
|
Linux C语言
Linux读写锁源码分析
本文分析了读写锁的实现原理与应用场景,基于glibc 2.17源码。读写锁通过读引用计数、写线程ID、条件变量等实现,支持读优先(默认)和写优先模式。读优先时,写锁可能饥饿;写优先时,读线程需等待写锁释放。详细解析了`pthread_rwlock_t`数据结构及加解锁流程,并通过实验验证:2000个读线程与1个写线程测试下,读优先导致写锁饥饿,写优先则正常抢占锁。
246 19
|
8月前
|
机器学习/深度学习 人工智能 自然语言处理
通义千问Qwen3,开源!
Qwen3正式发布并全部开源啦!
3754 50
|
7月前
|
Docker 容器
在openEuler 22.03 LTS上安装Docker CE和Docker Compose
以上就是在openEuler 22.03 LTS上安装Docker CE和Docker Compose的过程。希望这个指南能帮助你顺利完成安装。
1608 12
|
9月前
|
安全 API Swift
如何在苹果内购开发中获取App Store Connect API密钥-共享密钥理解内购安全-优雅草卓伊凡
如何在苹果内购开发中获取App Store Connect API密钥-共享密钥理解内购安全-优雅草卓伊凡
660 15
如何在苹果内购开发中获取App Store Connect API密钥-共享密钥理解内购安全-优雅草卓伊凡
|
机器学习/深度学习 编解码 自然语言处理
YOLOv8改进 | 2023 | CARAFE提高精度的上采样方法(助力细节长点)
YOLOv8改进 | 2023 | CARAFE提高精度的上采样方法(助力细节长点)
946 2
|
人工智能 计算机视觉 Python
AI计算机视觉笔记十九:Swin Transformer训练
本文介绍了使用自定义数据集训练和测试目标检测模型的步骤。首先,通过安装并使用标注工具labelme准备数据集;接着修改配置文件以适应自定义类别,并调整预训练模型;然后解决训练过程中遇到的依赖冲突问题并完成模型训练;最后利用测试命令验证模型效果。文中提供了具体命令及文件修改指导。
|
机器学习/深度学习 编解码 定位技术
【论文速递】ECCV2022 - 开销聚合与四维卷积Swin Transformer_小样本分割
【论文速递】ECCV2022 - 开销聚合与四维卷积Swin Transformer_小样本分割
|
机器学习/深度学习
损失函数大全Cross Entropy Loss/Weighted Loss/Focal Loss/Dice Soft Loss/Soft IoU Loss
损失函数大全Cross Entropy Loss/Weighted Loss/Focal Loss/Dice Soft Loss/Soft IoU Loss
751 2