YOLOv11改进策略【YOLO和Mamba】| 2024 VM-UNet,高效的特征提取模块VSS block 二次创新提高精度

简介: YOLOv11改进策略【YOLO和Mamba】| 2024 VM-UNet,高效的特征提取模块VSS block 二次创新提高精度

一、本文介绍

本文记录的是利用VM-UNet中的VSS block优化YOLOv11的目标检测网络模型VSS Block与传统模块不同,它汲取了VMamba模型的优势,通过特定结构设计,在保证计算效率的同时,精准建模局部特征学习长距离依赖实现局部特征的高效处理与长距离依赖关系的有效学习。本文将其应用于YOLOv11的改进与创新,能让模型更关注图像关键特征区域抑制背景等无关信息干扰,突出目标物体关键特征。


专栏目录:YOLOv11改进目录一览 | 涉及卷积层、轻量化、注意力、损失函数、Backbone、SPPF、Neck、检测头等全方位改进
专栏地址:YOLOv11改进专栏——以发表论文的角度,快速准确的找到有效涨点的创新点!

二、VM-UNet模型介绍

VM-UNet: Vision Mamba UNet for Medical Image Segmentation

VM-UNet模型设计的出发点是解决现有CNN-basedTransformer-based模型在医学图像分割中的局限性,利用State Space Models(SSMs)的优势,提出一种更有效的医学图像分割模型。

具体来说,CNN-based模型在捕捉长距离信息方面存在不足,而Transformer-based模型由于自注意力机制的二次复杂度导致计算负担较重SSMs模型如Mamba不仅在建模长距离依赖方面表现出色,还具有线性计算复杂度,这为VM-UNet的设计提供了理论基础。

2.1 VSS block的原理

  • VSS block基于现代SSM模型中的线性常微分方程(ODE)进行工作。它将一维输入函数或序列$x(t)$通过中间隐状态$h(t)$映射到输出$y(t)$。其中,状态矩阵$A$、投影参数$B$和$C$在模型中起着关键作用。
  • S4Mamba通过引入时间尺度参数$\Delta$并使用零阶保持(ZOH)作为离散化规则,将连续系统离散化,使模型更适合深度学习场景。离散化后的SSM模型可以通过线性递归全局卷积两种方式进行计算。

    2.3 VSS block的结构

  • 图b所示,输入经过Layer Normalization后被分为两个分支。在第一个分支中,输入通过线性层激活函数(默认为SiLU)。在第二个分支中,输入经过线性层深度可分离卷积激活函数后,进入2D-Selective-Scan(SS2D)模块进行特征提取。

在这里插入图片描述

  • SS2D模块由扫描扩展(scan expanding)、S6块扫描合并(scan merging)三个组件组成。
      - <font color=navy>**扫描扩展**</font>操作将输入图像沿**四个不同方向**展开为序列,这些序列由`S6块`进行特征提取。
      - <font color=navy>**S6块**</font>基于Mamba的S4框架,通过调整SSM的参数来引入**选择性机制**,能够<font color=darkorange>**区分和保留相关信息,过滤无关信息**</font>。
      - <font color=navy>**扫描合并**</font>操作将**四个方向**的序列求和合并,恢复输出图像大小。
      - 最后,两个分支的特征经过`Layer Normalization`后进行元素积操作,再通过**线性层混合**,并与**残差连接**相结合,形成`VSS block`的输出。
    

在这里插入图片描述

2.3 VSS block的优势

  • 高效的特征提取能力:通过两个分支的设计和SS2D模块,能够从不同角度对输入特征进行处理,充分提取多样化的特征信息,从而提高模型对图像的理解能力。
  • 选择性机制增强相关性:S6块的选择性机制使模型能够聚焦于重要信息,减少无关信息的干扰,有助于提高分割的准确性。
  • 适应性强:在不同的数据集和任务中,VSS block能够根据输入数据的特点动态调整特征提取过程,从而适应各种复杂的医学图像分割任务。

论文:https://arxiv.org/pdf/2402.02491
源码: https://github.com/JCruan519/VM-UNet

三、实现代码及YOLOv11修改步骤

模块完整介绍、个人总结、实现代码、模块改进、二次创新以及各模型添加步骤参考如下地址:

https://blog.csdn.net/qq_42591591/article/details/144259128

相关文章
|
编解码 计算机视觉
YOLOv11改进策略【YOLO和Mamba】| 替换骨干 Mamba-YOLOv11-T !!! 最新的发文热点
YOLOv11改进策略【YOLO和Mamba】| 替换骨干 Mamba-YOLOv11-T !!! 最新的发文热点
2032 7
YOLOv11改进策略【YOLO和Mamba】| 替换骨干 Mamba-YOLOv11-T !!! 最新的发文热点
|
机器学习/深度学习 计算机视觉
YOLOv11改进策略【YOLO和Mamba】| 替换骨干 Mamba-YOLOv11-L !!! 最新的发文热点
YOLOv11改进策略【YOLO和Mamba】| 替换骨干 Mamba-YOLOv11-L !!! 最新的发文热点
571 10
YOLOv11改进策略【YOLO和Mamba】| 替换骨干 Mamba-YOLOv11-L !!! 最新的发文热点
|
机器学习/深度学习 人工智能 并行计算
YOLOv11改进策略【YOLO和Mamba】| MLLA:Mamba-Like Linear Attention,融合Mamba设计优势的注意力机制
YOLOv11改进策略【YOLO和Mamba】| MLLA:Mamba-Like Linear Attention,融合Mamba设计优势的注意力机制
881 9
|
机器学习/深度学习 数据可视化 算法
YOLOv11改进目录一览 | 涉及卷积层、轻量化、注意力、损失函数、Backbone、SPPF、Neck、检测头等全方位改进
YOLOv11改进目录一览 | 涉及卷积层、轻量化、注意力、损失函数、Backbone、SPPF、Neck、检测头等全方位改进
2236 7
YOLOv11改进目录一览 | 涉及卷积层、轻量化、注意力、损失函数、Backbone、SPPF、Neck、检测头等全方位改进
|
算法 计算机视觉
YOLOv11改进策略【YOLO和Mamba】| 替换骨干 Mamba-YOLOv11-B !!! 最新的发文热点
YOLOv11改进策略【YOLO和Mamba】| 替换骨干 Mamba-YOLOv11-B !!! 最新的发文热点
791 9
|
机器学习/深度学习 算法 计算机视觉
YOLOv11改进策略【SPPF】| SimSPPF,简化设计,提高计算效率
YOLOv11改进策略【SPPF】| SimSPPF,简化设计,提高计算效率
2816 8
YOLOv11改进策略【SPPF】| SimSPPF,简化设计,提高计算效率
|
机器学习/深度学习 编解码 算法
【YOLOv8改进 - 特征融合NECK】SDI:多层次特征融合模块,替换contact操作
YOLOv8专栏探讨了该目标检测算法的创新改进,包括新机制和实战案例。文章介绍了U-Net v2,一种用于医学图像分割的高效U-Net变体,它通过SDI模块融合语义和细节信息,提升分割准确性。SDI模块结合空间和通道注意力,经通道减缩、尺寸调整和平滑后,用哈达玛积融合特征。提供的核心代码展示了SDI模块的实现。更多详情和论文、代码链接见原文。
|
机器学习/深度学习 人工智能 文字识别
ultralytics YOLO11 全新发布!(原理介绍+代码详见+结构框图)
本文详细介绍YOLO11,包括其全新特性、代码实现及结构框图,并提供如何使用NEU-DET数据集进行训练的指南。YOLO11在前代基础上引入了新功能和改进,如C3k2、C2PSA模块和更轻量级的分类检测头,显著提升了模型的性能和灵活性。文中还对比了YOLO11与YOLOv8的区别,并展示了训练过程和结果的可视化
24340 0
|
机器学习/深度学习 计算机视觉 Python
YOLOv5改进系列(2)——添加CBAM注意力机制
YOLOv5改进系列(2)——添加CBAM注意力机制
11904 1
YOLOv5改进系列(2)——添加CBAM注意力机制
|
机器学习/深度学习 自然语言处理 并行计算
【YOLOv8改进 -注意力机制】Mamba之MLLAttention :基于Mamba和线性注意力Transformer的模型
YOLOv8专栏探讨了该目标检测模型的创新改进,包括使用Mamba模型的线性注意力Transformer变体,称为MLLA。Mamba的成功关键在于遗忘门和块设计,MLLA结合了这些优点,提升了视觉任务的性能。文章提供全面分析,并提出MLLA模型,其在效率和准确性上超过多种视觉模型。论文和代码可在提供的链接中找到。MLLA Block的代码示例展示了如何整合关键组件以实现高效运算。更多配置详情见相关链接。