【论文速递】Arxiv2018 - 加州伯克利大学借助引导网络实现快速、准确的小样本分割

简介: 【论文速递】Arxiv2018 - 加州伯克利大学借助引导网络实现快速、准确的小样本分割

【论文速递】Arxiv2018 - 加州伯克利大学借助引导网络实现快速、准确的小样本分割

【论文原文】:Few-Shot Segmentation Propagation with Guided Networks

作者信息】:Kate Rakelly∗ Evan Shelhamer∗ Trevor Darrell Alexei Efros Sergey Levine

获取地址:https://arxiv.org/pdf/1806.07373

博主关键词: 小样本学习,语义分割,引导网络

推荐相关论文:

【论文精选】TPAMI2020 - PFENet_先验引导的特征富集网络_小样本语义分割
- https://phoenixash.blog.csdn.net/article/details/128720119

摘要:

基于学习的视觉分割方法已经在特定类型的分割任务上取得了进展,但受到必要的监督、固定任务的狭隘定义以及在纠正错误的推理过程中缺乏控制的限制。为了弥补标准方法的刚性和注释负担,我们解决了小样本分割的问题:给定少量图像和少量像素监督,相应地分割任何图像。我们提出了引导网络,它从任意数量的监督中提取潜在的任务表示,并优化我们的端到端架构,以实现快速、准确的小样本分割。 我们的方法可以在没有进一步优化的情况下切换任务,并在得到更多指导时快速更新。我们报告了从每个概念一个像素分割的第一个结果,并展示了实时交互式视频分割。我们的统一方法跨空间传播像素注释以进行交互式分割,跨时间传播像素注释以进行视频分割,跨场景传播像素注释以进行语义分割。我们的引导分割器在注释量和时间的准确性方面是最先进的。有关代码、模型和更多细节,请参阅http://github.com/shelhamer/revolver。

简介:

学习特定类型的分割,甚至将现有模型扩展到新任务(如新的语义类),通常需要收集和注释大量数据,并(重新)训练模型进行多次迭代。目前的方法是由数千或数万个完全注释的图像来监督的,这样即使是一个“小”数据集也包含数十亿个像素级注释。收集这些密集的注释非常耗时、乏味且容易出错。有许多具有实际和科学意义的任务,在这种规模上的注释是不切实际的,甚至是不可行的,例如平面设计、医学成像等等。

半监督和弱监督分割方法可以跨任务中的输入传播注释(整个视频中的实例分割)或跨不同类型的注释(标签、框和掩码),但目前的方法是特定于任务或监督形式的,并且通常在计算或数据方面效率低下。一旦学会,这些方法很难指导或纠正,并且对少量的进一步注释不敏感。另一方面,交互式分割方法调整到给定的任务很少注释,并可以校正。然而,注释只控制对同一图像的推断,不能通知分割新的输入。

相反,我们解决了小样本分割的问题:只给出一些带有稀疏像素级注释的图像来指示任务,相应地分割没有注释的图像。我们统一的框架是“像素输入,像素输出”,用于从图像内部和跨图像传播任何像素注释集合到未注释的像素进行推断。我们直接优化引导网络来推断由稀疏注释定义的潜在任务,并分割以该任务为条件的新输入。 我们的小样本分段器从每个概念的一个像素中分割出新的概念,并在几乎瞬间结合进一步的注释来更新和改进推理。现有的方法是为特定的分割任务而设计的,在极其稀疏的区域失败,而我们的方法可以在光谱上从一个注释的像素传播到完整、密集的掩模。我们的小样本分割器在根据注释进行切换时是任务不可知的,在从少数像素级注释中学习数据时是高效的,并且在逐步纳入更多监督时是可纠正的。

小样本设置将输入分为一个带注释的支持(监督要完成的任务)和一个应相应地进行分段的无注释查询。在这项工作中,我们解决了小样本分割问题的这些关键部分:(1)如何将稀疏的、结构化的支持总结为任务表示,(2)如何在给定的任务表示上调整像素推理,以及(3)如何综合分割任务的准确性和一般性。结构化输出由于其高维、统计依赖和倾斜的输入和输出分布,对这些方面都提出了挑战。 我们在图像分类设置中连接小样本方法,因为我们使它们适应于分割,以便与我们的方法进行比较。

我们提出了一类新的引导网络,它扩展了小样本和全卷积架构;参见图1。给定一个标注的支持集和查询图像,引导g提取任务的潜在表示z,它通过fθ指导查询的分割。 我们对如何编码支持进行了全面的比较(第4.1节),并引入了一种用于融合图像和注释的新机制,该机制提高了学习时间和推理精度。我们研究了不同的引导推理选择(第4.2节),以确定哪个最适合结构化输出。一旦经过训练,我们的模型就不需要进一步的优化来处理新的少量任务,并且可以快速增量地合并额外的注释来改变任务或纠正错误。

我们在各种具有挑战性的分割问题上评估了我们的方法:5.1中的交互式图像分割,5.2中的语义分割,5.3中的视频对象分割和5.4中的实时交互式视频分割。图2说明了我们所考虑的问题。我们的结果的重点是在稀疏区域,对于这种情况,收集注释是实用的。在所有情况下,我们的准确性都是最先进的注释量和所需的时间。我们的方法合并新注释的速度使它适合实时交互使用。

目录
相关文章
|
2月前
|
机器学习/深度学习 计算机视觉 知识图谱
【YOLOv8改进】MobileViT 更换主干网络: 轻量级、通用且适合移动设备的视觉变压器 (论文笔记+引入代码)
MobileViT是针对移动设备的轻量级视觉Transformer网络,结合CNN的局部特征、Transformer的全局注意力和ViT的表示学习。在ImageNet-1k上,它以600万参数实现78.4%的top-1准确率,超越MobileNetv3和DeiT。MobileViT不仅适用于图像分类,还在目标检测等任务中表现出色,且优化简单,代码已开源。YOLOv8引入了MobileViT块,整合卷积和Transformer结构,提升模型性能。更多详情可参考相关专栏和链接。
|
18天前
|
Web App开发 自然语言处理 算法
一文搞懂:【论文笔记】BINE:二分网络嵌入
一文搞懂:【论文笔记】BINE:二分网络嵌入
13 0
|
2月前
|
机器学习/深度学习 数据可视化 计算机视觉
【YOLOv8改进】MCA:用于图像识别的深度卷积神经网络中的多维协作注意力 (论文笔记+引入代码)
YOLO目标检测专栏介绍了YOLO的创新改进和实战案例,包括多维协作注意力(MCA)机制,它通过三分支架构同时处理通道、高度和宽度注意力,提高CNN性能。MCA设计了自适应组合和门控机制,增强特征表示,且保持轻量化。该模块适用于各种CNN,实验证明其在图像识别任务上的优越性。此外,文章还展示了如何在YOLOv8中引入MCA层的代码实现和相关任务配置。
|
1月前
|
网络协议 算法 Linux
【嵌入式软件工程师面经】Linux网络编程Socket
【嵌入式软件工程师面经】Linux网络编程Socket
48 1
|
3天前
|
Linux
linux网络统计信息和端口占用情况基本语法
linux网络统计信息和端口占用情况基本语法
|
10天前
|
网络协议 安全 Ubuntu
7 个有用的免费 Linux 网络隧道
【7月更文挑战第4天】
46 0
7 个有用的免费 Linux 网络隧道
|
23天前
|
安全 物联网 Linux
学习Linux对网络安全的重要性
**学习Linux对网络安全至关重要:** 1. 开源操作系统广泛应用于服务器、网络设备,掌握Linux是安全专家必备技能。 2. Linux内置安全特性,如最小权限和防火墙,加上丰富的安全工具,提供强大保障。 3. 可定制性允许灵活配置,满足安全需求,开源社区提供持续更新和教育资源。 4. 学习Linux能提升攻防能力,用于系统加固和渗透测试,适应跨平台安全场景。 5. 随着云计算和物联网发展,Linux在网络安全中的角色日益关键。
47 3
|
10天前
|
网络协议 Linux 开发工具
配置Linux固定IP地址,为什么要固定IP,因为他是通DHCP服务获取的,DHCP服务每次重启都会重新获取一次ip,VMware编辑中有一个虚拟网络编辑器
配置Linux固定IP地址,为什么要固定IP,因为他是通DHCP服务获取的,DHCP服务每次重启都会重新获取一次ip,VMware编辑中有一个虚拟网络编辑器
|
10天前
|
算法 网络协议 Shell
掌握Linux网络:深入理解TC —— 你的流量控制利器
目前需要做一款关于Linux下对于某IP限制的一个工具(QOS),在网上寻找了许多关于TC的教程,大多数都是一些比较基础的教学,且多数都是对网口的一些限制,然后自己研究了一段时间,最后有一些小小的了解,故在此分享给大家。
|
12天前
|
域名解析 网络协议 Linux
linux网络-- 手动配置ip地址
linux网络-- 手动配置ip地址