【论文速递】ICLR2018 - 用于小样本语义分割的条件网络

简介: 【论文速递】ICLR2018 - 用于小样本语义分割的条件网络

【论文速递】ICLR2018 - 用于小样本语义分割的条件网络

【论文原文】:CONDITIONAL NETWORKS FOR FEW-SHOT SEMANTIC SEGMENTATION(Workshop track - ICLR 2018)

作者信息】:Kate Rakelly Evan Shelhamer Trevor Darrell Alexei Efros Sergey Levine

获取地址:https://openreview.net/pdf?id=SkMjFKJwG

博主关键词: 小样本学习,语义分割,条件网络

推荐相关论文:

- 无

摘要:

few-shot学习方法的目标是在低数据状态下获得良好的性能。结构化输出任务,如分割,由于其高维和输出之间的统计依赖性,对小样本学习提出了困难。为了解决这个问题,我们提出了co-FCN,这是一个通过端到端优化学习的条件网络,可以执行快速、准确的小样本分割。网络条件建立在一个带标注的支持图像集上,通过特征融合对一个未标注的查询图像进行推理。一旦学会,我们的条件反射方法就不需要对新数据进行进一步优化。注释被限制在一个单独的向前传递中,这使得我们的方法适合交互使用。我们用密集和稀疏注释来评估我们的co-FCN,即使只给出一个正像素和一个负像素,它也能达到具有竞争力的准确性,减少了分割新概念的注释负担。

简介:

卷积网络正在推动对事物和地点的视觉识别方面的进展,这在一定程度上是由收集昂贵且耗时的大型标记数据集实现的。few-shot学习有望提高数据效率;在极端情况下,一次性学习只需要一个新概念的单个注释。为了快速适应新的领域或任务,目前的一些方法依赖于元学习或学会学习。虽然这些方法很有前途,但重点是分类,而对结构化输出任务的研究很少。由于输出空间的高维,以及输入中像素的空间相关性导致的输出之间的统计依赖关系,目前的方法在很大程度上不能即开即用地应用于结构化输出设置。

语义分割是视觉识别中具有挑战性的核心任务。端到端优化的网络已经实现了最先进的性能,但依赖于大量的像素级标记数据集,这些数据集的收集特别繁重,使得注释负担的减轻实际上非常重要。因此,我们解决了由Shaban等人(2017)首次提出的小样本语义分割问题。在我们的co-FCN网络中,我们增加了FCN (Shelhamer et al., 2016)架构,并加入了一个条件分支,以合并few-shot标注。测试时无梯度流动;给定一个新的few-shot任务,求解它是网络中的一次向前传递。在训练过程中,我们通过从密集标记的语义分割数据集中采样来模拟few-shot任务。

Fig. 1. co-FCN在网络的单次向前传递中进行小样本分割。调节分支(顶部)将支持图像和(密集或稀疏)标注按通道连接起来,并将它们编码为特征(如图所示)或参数。分段分支(底部)在这个编码条件上密集分段查询。对于训练(未显示),从密集标记的数据集合成few-shot任务。该损失将查询图像的预测分割与目标进行比较,目标是由查询的支持和真实语义分割共同定义的。这两个分支是端到端联合学习的。

我们的工作与一次性和交互式的细分方法有关。Shaban等人(2017)是第一个解决小样本语义分割的人。它们假设密集的像素级小样本注释。我们的方法在只有一个正像素和一个负像素的情况下达到了几乎相同的精度。Caelles等人(2017)展示了微调对视频对象分割的有效性,但要求在测试时对每个输入进行优化,在计算和注释方面成本太高。Xu等人(2016)学习了最先进的交互式对象分割,但仅限于在单个图像中传播注释,并且不能跨图像传播。我们的贡献包括处理稀疏的像素级注释,调节特征与参数,以及评估更强的分割和元学习基线。

目录
相关文章
|
5月前
|
机器学习/深度学习 计算机视觉 知识图谱
【YOLOv8改进】MobileViT 更换主干网络: 轻量级、通用且适合移动设备的视觉变压器 (论文笔记+引入代码)
MobileViT是针对移动设备的轻量级视觉Transformer网络,结合CNN的局部特征、Transformer的全局注意力和ViT的表示学习。在ImageNet-1k上,它以600万参数实现78.4%的top-1准确率,超越MobileNetv3和DeiT。MobileViT不仅适用于图像分类,还在目标检测等任务中表现出色,且优化简单,代码已开源。YOLOv8引入了MobileViT块,整合卷积和Transformer结构,提升模型性能。更多详情可参考相关专栏和链接。
|
2月前
|
机器学习/深度学习 算法 网络架构
神经网络架构殊途同归?ICML 2024论文:模型不同,但学习内容相同
【8月更文挑战第3天】《神经语言模型的缩放定律》由OpenAI研究人员完成并在ICML 2024发表。研究揭示了模型性能与大小、数据集及计算资源间的幂律关系,表明增大任一资源均可预测地提升性能。此外,论文指出模型宽度与深度对性能影响较小,较大模型在更多数据上训练能更好泛化,且能高效利用计算资源。研究提供了训练策略建议,对于神经语言模型优化意义重大,但也存在局限性,需进一步探索。论文链接:[https://arxiv.org/abs/2001.08361]。
33 1
|
3月前
|
计算机视觉 网络架构
【YOLOv8改进 - 卷积Conv】DWRSeg:扩张式残差分割网络,提高特征提取效率和多尺度信息获取能力,助力小目标检测
YOLO目标检测专栏探讨了YOLO的创新改进,如多尺度特征提取的DWRSeg网络。该网络通过区域残差化和语义残差化提升效率,使用DWR和SIR模块优化高层和低层特征。DWRSeg在Cityscapes和CamVid数据集上表现优秀,速度与准确性兼备。论文和代码已公开。核心代码展示了一个包含DWR模块的卷积层。更多配置详情见相关链接。
|
2月前
|
人工智能 算法 安全
【2023 年第十三届 MathorCup 高校数学建模挑战赛】C 题 电商物流网络包裹应急调运与结构优化问题 赛后总结之31页论文及代码
本文总结了2023年第十三届MathorCup高校数学建模挑战赛C题的解题过程,详细阐述了电商物流网络在面临突发事件时的包裹应急调运与结构优化问题,提出了基于时间序列预测、多目标优化、遗传算法和重要性评价模型的综合解决方案,并提供了相应的31页论文和代码实现。
54 0
|
4月前
|
Web App开发 自然语言处理 算法
一文搞懂:【论文笔记】BINE:二分网络嵌入
一文搞懂:【论文笔记】BINE:二分网络嵌入
34 0
|
5月前
|
机器学习/深度学习 数据可视化 计算机视觉
【YOLOv8改进】MCA:用于图像识别的深度卷积神经网络中的多维协作注意力 (论文笔记+引入代码)
YOLO目标检测专栏介绍了YOLO的创新改进和实战案例,包括多维协作注意力(MCA)机制,它通过三分支架构同时处理通道、高度和宽度注意力,提高CNN性能。MCA设计了自适应组合和门控机制,增强特征表示,且保持轻量化。该模块适用于各种CNN,实验证明其在图像识别任务上的优越性。此外,文章还展示了如何在YOLOv8中引入MCA层的代码实现和相关任务配置。
|
5月前
|
机器学习/深度学习 计算机视觉
【YOLOv8改进】 YOLOv8 更换骨干网络之GhostNetV2 长距离注意力机制增强廉价操作,构建更强端侧轻量型骨干 (论文笔记+引入代码)
该专栏聚焦YOLO目标检测的创新改进与实战,介绍了轻量级CNNs和注意力机制在移动设备上的应用。文章提出了一种名为GhostNetV2的新架构,结合了硬件友好的DFC注意力机制,强化了特征表达能力和全局信息捕获,同时保持低计算成本和高效推理。GhostNetV2在ImageNet上以167M FLOPs达到75.3%的top-1准确率,优于同类模型。创新点包括DFC注意力、模型结构优化和效率提升。源代码可在GitHub和MindSpore平台上找到。此外,还提到了YOLOv8的相关实现和任务配置。
|
5天前
|
存储 安全 网络安全
云计算与网络安全:技术融合下的信息安全新挑战
【9月更文挑战第29天】在数字化浪潮的推动下,云计算服务如雨后春笋般涌现,为各行各业提供了前所未有的便利和效率。然而,随着数据和服务的云端化,网络安全问题也日益凸显,成为制约云计算发展的关键因素之一。本文将从技术角度出发,探讨云计算环境下网络安全的重要性,分析云服务中存在的安全风险,并提出相应的防护措施。我们将通过实际案例,揭示如何在享受云计算带来的便捷的同时,确保数据的安全性和完整性。
|
2天前
|
安全 网络协议 网络安全
网络安全与信息安全:漏洞、加密与意识的三重奏
【9月更文挑战第32天】在数字世界的交响乐中,网络安全是那不可或缺的乐章。本文将带您深入探索网络安全的三大主题:网络漏洞的识别与防范、加密技术的奥秘以及安全意识的重要性。通过深入浅出的方式,我们将一起揭开这些概念的神秘面纱,并学习如何在实际生活中应用它们来保护自己的数字足迹。让我们开始这场既刺激又富有教育意义的旅程,提升个人和组织的网络安全防御能力。
|
1天前
|
存储 安全 算法
网络安全与信息安全:漏洞、加密与意识的三维防线
【9月更文挑战第33天】在数字化浪潮中,网络安全与信息安全成为守护数据宝藏的坚固盾牌。本文将深入探讨网络防御的三大支柱:安全漏洞的识别与防范,加密技术的应用和原理,以及提升个人和组织的安全意识。通过这些知识的分享,我们旨在为读者提供一套全面的网络安全策略,确保数字资产的安全无虞。
下一篇
无影云桌面