【论文速递】ICCV2021 - 基于超相关压缩实现实时高精度的小样本语义分割

简介: 【论文速递】ICCV2021 - 基于超相关压缩实现实时高精度的小样本语义分割

【论文速递】ICCV2021 - 基于超相关压缩的小样本语义分割

【论文原文】:Hypercorrelation Squeeze for Few-Shot Segmentation

作者信息】:Juhong Min Dahyun Kang Minsu Cho

获取地址:https://openaccess.thecvf.com/content/ICCV2021/papers/Min_Hypercorrelation_Squeeze_for_Few-Shot_Segmentation_ICCV_2021_paper.pdf

博主关键词: 小样本学习,语义分割,4D卷积,超相关

推荐相关论文:

【论文速递】ECCV2022 - 开销聚合与四维卷积Swin Transformer_小样本分割
- https://phoenixash.blog.csdn.net/article/details/128698210
【论文速递】ACM2022 - 基于嵌入自适应更新和超类表示的增量小样本语义分割
- https://phoenixash.blog.csdn.net/article/details/128676817

摘要:

小样本语义分割的目的是学习仅使用目标类的一些带注释的支持图像从查询图像中分割目标对象。这项具有挑战性的任务需要理解不同层次的视觉线索,并分析查询和支持图像之间的细粒度对应关系。为了解决这个问题,我 们提出了利用多级特征相关和高效4D卷积的超相关挤压网络(HSNet)。它从中间卷积层的不同层次中提取不同的特征,构造一个4D相关张量集合,即超相关。 该方法采用高效的金字塔结构的中心-轴四维卷积,将超相关的高级语义线索和低级几何线索从粗到细逐步挤压成精确的分割面具。在PASCAL-5i、COCO-20i和FSS-1000的标准小样本分割基准上的显著性能改进验证了所提方法的有效性。

简介:

深度卷积神经网络[17,20,64]的出现促进了许多计算机视觉任务的巨大进展,包括对象跟踪[28,29,45]、视觉对应[22,44,48]和语义分割[7,47,62]等等。尽管深度网络是有效的,但由于数据标注需要大量的人力,特别是密集的预测任务,如语义分割,因此深度网络对大规模数据集中大量注释示例的需求[9,11,35]仍然是一个基本的限制。为了应对这一挑战,人们尝试了各种半监督和弱监督的分割方法[6,26,39,66,72,77,88],从而有效地缓解了数据饥饿的问题。然而,由于只有少数带注释的训练例,深度网络泛化能力差的问题仍然是许多小样本分割方法[10,12,13,19,33,36,37,46,54,61,63,69,70,74,75,80,83,86,87,89]难以解决的主要问题。

相比之下,人类的视觉系统很容易在极其有限的监督下实现对新物体外观的概括。这种智能的关键在于能够在同一类的不同实例之间找到可靠的通信。 最近在语义对应方面的工作表明,利用密集中间特征[38,42,44]和 用高维卷积处理相关张量[30,58,71]在建立精确对应方面非常有效 。然而,虽然最近的小样本分割研究开始积极探索相关学习的方向,但 其中大多数[36,37,46,65,73,75,80]既没有利用CNN早期到晚期层的不同层次的特征表示,也没有构建两两的特征相关性来捕获细粒度的相关模式。 已经有一些尝试[74,86]利用多层特征的密集相关,但从简单地将密集相关用于图注意,仅使用中间卷积层的一小部分的意义上来说,这些尝试是有限的。

在这项工作中,我们结合了近年来视觉对应研究中最具影响力的两种技术,多层次特征和4D卷积,设计了一个新的框架,称为超相关挤压网络(HSNet),用于完成小样本语义分割任务。如图1所示,我们的网络 利用来自许多不同的中间CNN层的不同几何/语义特征表示来构建一个4D相关张量集合,即超相关 ,它表示多个视觉方面的丰富对应集。在FPN[34]的工作之后,我们采用金字塔设计来捕捉高级语义和低级几何线索,使用深度堆叠的4D conv层以粗到细的方式进行精确的面具预测。为了减少大量使用高维卷积所带来的计算量,我们通过合理的权值稀疏化设计了一种高效的4D核,该核在实现实时推理的同时,比现有的核更有效、更轻量。对PASCAL-5i[61]、COCO-20i[35]和FSS-1000[33]标准小样本分割基准的改进验证了所提方法的有效性。

目录
相关文章
|
自然语言处理 算法 数据挖掘
自蒸馏:一种简单高效的优化方式
背景知识蒸馏(knowledge distillation)指的是将预训练好的教师模型的知识通过蒸馏的方式迁移至学生模型,一般来说,教师模型会比学生模型网络容量更大,模型结构更复杂。对于学生而言,主要增益信息来自于更强的模型产出的带有更多可信信息的soft_label。例如下右图中,两个“2”对应的hard_label都是一样的,即0-9分类中,仅“2”类别对应概率为1.0,而soft_label
自蒸馏:一种简单高效的优化方式
|
3月前
|
人工智能 弹性计算 双11
阿里云2025年双十一活动介绍
‌阿里云2025年双十一活动已开启,优惠时间从10月24日持续至11月30日‌,涵盖云服务器、AI大模型等产品,最高可领1728元优惠券,部分AI资源免费体验。
503 1
|
9月前
|
存储 Unix Shell
Shell 输出命令完全指南:echo 与 printf 的深度剖析
本文深入解析了 Shell 编程中 `echo` 和 `printf` 两个核心输出命令的用法与区别。`echo` 简单易用,适合基础输出;`printf` 功能强大,支持复杂格式化。文章从语法、转义序列、高级技巧到实际应用场景(如日志记录、进度显示)逐一讲解,并对比两者的性能与适用场景,帮助开发者根据需求灵活选择。最后通过进阶技巧和常见问题解答,进一步提升对两者的掌握程度。
467 1
|
Java 测试技术 开发者
阿里正式发布《Java开发手册》终极版!
本文讲的是阿里正式发布《Java开发手册》终极版!,别人都说我们是码农,但我们知道,自己是个艺术家。也许我们不过多在意自己的外表和穿着,但我们不羁的外表下,骨子里追求着代码的美、质量的美。而代码规约其实就是一个对美的定义。
76615 0
|
搜索推荐 数据挖掘 语音技术
弹幕树洞项目功能新增篇
【9月更文挑战第25天】这是对弹幕树洞项目的功能改进建议,包括增强互动功能(如回复弹幕、点赞与踩),个性化设置(如主题选择、自定义字体颜色、隐私设置),拓展社交功能(如关注用户、分享功能、社区活动),数据分析与反馈(如情绪分析、热门话题、用户反馈)以及多媒体支持(如图片和表情、语音弹幕)。这些新增功能旨在使项目更丰富、有趣且实用,提升用户体验。
228 4
|
前端开发 网络架构
计算机网络——第一章时延部分深入学习、相关习题及详细解析
计算机网络——第一章时延部分深入学习、相关习题及详细解析
973 0
|
存储 网络协议 中间件
双活数据中心建设要点
【2月更文挑战第26天】
|
机器学习/深度学习 搜索推荐 算法
# 【推荐系统入门到项目实战】(五):SVD矩阵分解 -
# 【推荐系统入门到项目实战】(五):SVD矩阵分解
# 【推荐系统入门到项目实战】(五):SVD矩阵分解 -
|
运维 算法 大数据
基于实时计算(Flink)与高斯模型构建实时异常检测系统
案例与解决方案汇总页:阿里云实时计算产品案例&解决方案汇总 1. 概述 异常检测(anomaly detection)指的是对不符合预期模式或数据集(英语:dataset)中其他项目的项目、事件或观测值的识别。
8566 0

热门文章

最新文章