Segment-Anything的一些相关论文总结

简介: Segment-Anything的一些相关论文总结

1、 Segment Anything Model (SAM) Enhanced Pseudo Labels for Weakly Supervised Semantic Segmentation

Tianle Chen, Zheda Mai, Ruiwen Li, Wei-lun Chao

https://arxiv.org/abs/2305.05803

图像级监督的弱监督语义分割(WSSS)由于其标注成本较像素级标注低而受到越来越多的关注。大多数现有方法依赖于类激活图(Class Activation Maps, CAM)来生成像素级的伪标签进行监督训练。但是CAM经常会遇到部分激活——激活最具辨别性的部分而不是整个对象区域,以及错误激活——不必要地激活对象周围的背景。这篇论文引入了一种简单而有效的方法来解决这些限制,利用最近发布的SAM来生成更高质量的伪标签。SAM是一种分割基础模型,它在将图像分割成片段方面表现出较强的零样本能力,但缺乏对这些区域的语义标记。所以论文使用特定类的伪标签作为选择最相关掩码的信号,并标记它们以生成该类的精细伪标签。SAM生成的片段非常精确,从而大大改善了部分激活和错误激活。

2、Personalize Segment Anything Model with One Shot

Renrui Zhang, Zhengkai Jiang, Ziyu Guo, Shilin Yan, Junting Pan, Hao Dong, Peng Gao, Hongsheng Li

https://arxiv.org/pdf/2305.03048.pdf

SAM已经被证明是一个强大而快速的框架,彻底改变了分割模型。虽然SAM具有普遍性,但在没有人工提示的情况下为特定的视觉概念定制SAM仍然有待研究中。这篇论文提出了一种无需训练的SAM微调方法,称为PerSAM。只要给定一张带有参考掩码的图像,PerSAM首先通过位置先验定位目标概念,并通过三种技术将其分割到其他图像或视频中:目标引导注意力,目标语义提示和级联后细化。这样就可以在没有任何训练的情况下有效地将SAM进行定制化。

代码和演示发布在https://github.com/ZrrSkywalker/Personalize-SAM

3、Zero-shot performance of the Segment Anything Model (SAM) in 2D medical imaging: A comprehensive evaluation and practical guidelines

Christian Mattjie, Luis Vinicius de Moura, Rafaela Cappelari Ravazio, Lucas Silveira Kupssinskü, Otávio Parraga, Marcelo Mussi Delucis, Rodrigo Coelho Barros

https://arxiv.org/abs/2305.00109

医学成像中的分割是诊断、监测和治疗各种疾病和医疗条件的关键组成部分。医学分割领域由许多专门的深度学习模型主导,每个模型都针对特定的分割任务和图像模式进行了微调。SAM采用了ViT神经架构,并利用大量的训练数据集来分割几乎任何对象;但是其在医学领域的适用性尚未得到研究。这篇论文通过在四种成像方式(包括x射线、超声、皮肤镜和结肠镜)的六个数据集上实施八种不同的提示策略,探索了SAM在医学成像中的零样本性能

源代码以及演示:https://github.com/Malta-Lab/SAM-zero-shot-in-Medical-Imaging

4、Customized Segment Anything Model for Medical Image Segmentation

Author : Kaidong Zhang, Dong Liu

https://arxiv.org/abs/2304.13785

论文提出了医学图像分割的通用解决方案SAMed。SAMed以大规模图像分割模型segmentation Anything model (SAM)为基础,探索针对医学图像分割的定制化大规模模型的研究新范式。SAMed将低秩调优策略应用于SAM图像编码器,并在标记医学图像分割数据集上与提示编码器和掩码解码器一起进行调优。由于SAMed只更新SAM参数的一小部分,因此在实际使用中,它的部署成本和存储成本非常小。

SAMed的代码 https://github.com/hitachinsk/SAMed

5、An Empirical Study on the Robustness of the Segment Anything Model (SAM)

Yuqing Wang, Yun Zhao, Linda Petzold

https://arxiv.org/abs/2305.06422

SAM)是一般图像分割的基础模型,它主要在自然图像上表现出令人印象深刻的性能,但了解其对各种图像扰动和域的稳健性对于经常出现此类挑战的实际应用至关重要。这篇论文在不同的现实世界条件下对SAM进行了全面的稳健性调查。实验包含了大范围的图像扰动。并且实验结果表明,在扰动图像下,SAM的性能普遍下降,并且在不同的扰动下具有不同程度的脆弱性。但是通过定制提示技术和利用基于每个数据集独特特征的领域知识,可以增强模型对这些扰动的弹性,解决数据集特定的挑战。

6、A Comprehensive Survey on Segment Anything Model for Vision and Beyond

Chunhui Zhang, Li Liu, Yawen Cui, Guanjie Huang, Weilin Lin, Yiqian Yang, Yuehong Hu

https://arxiv.org/abs/2305.08196

SAM在打破分割边界方面取得了重大进展,极大地促进了计算机视觉基础模型的发展。为了充分理解SAM,论文进行了一项调查研究。作为第一个全面回顾基于SAM基础模型的任何视觉及其他任务分割进展的工作,通过讨论其历史发展,最新进展以及对广泛应用的深刻影响,重点关注其在各种任务和数据类型中的应用。首先介绍了包括SAM在内的基础模型的背景和术语,以及与SAM同时代的最先进的方法,这些方法对于分割任何任务都很重要。然后,分析和总结了SAM在各种图像处理应用中的优势和局限性,包括软件场景、现实场景和复杂场景。

https://avoid.overfit.cn/post/92f50aa2951d4dd89cfc4fe71e0531ef

作者:Monodeep Mukherjee

目录
相关文章
|
5月前
|
编解码 数据可视化 定位技术
60行代码就可以训练/微调 Segment Anything 2 (SAM 2)
本文演示了如何在仅60行代码内(不包括标注和导入)对SAM2进行微调。
377 1
60行代码就可以训练/微调 Segment Anything 2 (SAM 2)
|
5月前
|
机器学习/深度学习 人工智能 资源调度
【博士每天一篇文献-算法】连续学习算法之HAT: Overcoming catastrophic forgetting with hard attention to the task
本文介绍了一种名为Hard Attention to the Task (HAT)的连续学习算法,通过学习几乎二值的注意力向量来克服灾难性遗忘问题,同时不影响当前任务的学习,并通过实验验证了其在减少遗忘方面的有效性。
101 12
|
5月前
|
机器学习/深度学习 存储 开发框架
【博士每天一篇文献-算法】NICE Neurogenesis Inspired Contextual Encoding for Replay-free Class Incremental Learn
NICE(Neurogenesis Inspired Contextual Encoding)是一种新型深度神经网络架构,旨在通过模拟生物神经系统的成熟过程来解决类别增量学习中的灾难性遗忘问题,无需重放旧样本即可实现有效的增量学习。
72 5
|
5月前
|
存储 机器学习/深度学习 算法
【博士每天一篇文献-算法】连续学习算法之RWalk:Riemannian Walk for Incremental Learning Understanding
RWalk算法是一种增量学习框架,通过结合EWC++和修改版的Path Integral算法,并采用不同的采样策略存储先前任务的代表性子集,以量化和平衡遗忘和固执,实现在学习新任务的同时保留旧任务的知识。
124 3
|
5月前
|
机器学习/深度学习 存储 人工智能
【博士每天一篇文献-算法】Memory aware synapses_ Learning what (not) to forget
本文介绍了一种名为“记忆感知突触”(Memory Aware Synapses, MAS)的终身学习方法,该方法通过无监督在线评估神经网络参数的重要性,并在新任务学习时对重要参数的更改进行惩罚,有效防止了旧任务知识的覆盖,实现了内存效率和性能提升,同时具有灵活性和通用性。
70 1
|
机器学习/深度学习 人工智能 关系型数据库
简化版Transformer :Simplifying Transformer Block论文详解
在这篇文章中我将深入探讨来自苏黎世联邦理工学院计算机科学系的Bobby He和Thomas Hofmann在他们的论文“Simplifying Transformer Blocks”中介绍的Transformer技术的进化步骤。这是自Transformer 开始以来,我看到的最好的改进。
111 0
|
编解码 人工智能 自然语言处理
【论文精读】Arxiv 2023 - Segment Anything
我们介绍了Segment Anything (SA)项目:一个用于图像分割的新任务、模型和数据集。在数据收集循环中使用我们的高效模型,我们构建了迄今为止(到目前为止)最大的分割数据集,在1100万张授权的图像上拥有超过10亿个掩码。
192 0
|
算法
Single TPR论文解读
Single TPR是2015年提出来的,是基于TPR的进一步改进,TPR论文解读可以参考Topical PageRank(TPR)论文解读_Trouble…的博客-CSDN博客。
109 0
|
机器学习/深度学习 PyTorch 算法框架/工具
【论文精读】ISBI 2022 - Retinal Vessel Segmentation with Pixel-wise Adaptive Filters
由于视网膜血管的纹理复杂和成像对比度低,导致精确的视网膜血管分割具有挑战性。以前的方法通常通过级联多个深度网络来细化分割结果
139 0
|
机器学习/深度学习 编解码 PyTorch
CVPR2021-即插即用 | Coordinate Attention详解与CA Block实现(文末获取论文原文)(一)
CVPR2021-即插即用 | Coordinate Attention详解与CA Block实现(文末获取论文原文)(一)
1329 0