大连理工卢湖川团队TMI顶刊新作 | M^2SNet: 新颖多尺度模块 + 智能损失函数 = 通用图像分割SOTA网络

简介: 大连理工卢湖川团队TMI顶刊新作 | M^2SNet: 新颖多尺度模块 + 智能损失函数 = 通用图像分割SOTA网络

640.png


Title: SNet: Multi-scale in Multi-scale Subtraction Network for Medical Image Segmentation

Paper: https://arxiv.org/pdf/2303.10894.pdf

Code: https://github.com/Xiaoqi-Zhao-DLUT/MSNet

导读

医学图像分割领域的著名网络 U-Net,相信大家没用过也听说过。这是 2015 年提出来网络,其基于 U 型结构,并使用相加或拼接的方式,逐步融合解码器中不同级别特征,直到现在依然有许多工作都是这种结构进行改进创新。

然而,这两种操作容易生成大量冗余信息,这将削弱不同级别特征之间的互补性,导致很难准确地定位病变目标以及导致病变目标的边缘模糊。

针对上述的难点,本文介绍了一种针对医学图像的多尺度减法网络(multi-scale subtraction network, M2SNet),旨在解决现有方法在融合不同级别特征时产生冗余信息的问题,从而导致病灶定位不准确和边缘模糊的情况。

本文设计了基本的减法单元 (subtraction unit, SU) 来产生编码器中相邻级别之间的差异特征,并将单一尺度的 SU 扩展到内层多尺度 SU ,提供像素级和结构级别的差异信息给解码器。此外,还使用具有不同感受野的金字塔多尺度 SU 在不同级别上进行特征聚合,从而获得丰富的多尺度差异信息。最后,构建了一个无需训练的网络 LossNet,从底层到顶层全面监督任务感知特征,从而驱动多尺度减法网络同时捕捉详细和结构性提示。该方法在不同的评估指标下,在包括彩色结肠镜成像、超声成像、计算机断层扫描 (CT) 和光学相干断层扫描 (OCT) 在内的四种不同医学图像分割任务的十一个数据集上获得了惊艳的性能表现

创作背景

图1. 多种医学图像分割模型架构对比

文章列举了医学图像分割的三大挑战:

U 形网络结构

UNet、UNet++、attention U-Net

直接使用元素加法或拼接来融合来自编码器的不同层级特征,没有更多地关注不同层级之间的差异性信息,导致生成冗余信息并削弱了层级特征的特点,从而无法平衡精确的定位和微妙的边界细化。

感受野受限

单一尺度的卷积核难以捕捉大小不同的物体的上下文信息。虽然 ASPPDenseASPP 等多尺度模块能提取多尺度信息,但同时也会产生许多额外的参数与计算量。

手工设计损失函数的局限性

L1 loss、CE loss、SSIM loss

虽然这些基本的损失函数及其变体具有不同的优化特性,但是设计复杂的数学形式对于许多研究来说真的很耗时。

为了解决上述问题,本文提出了一种新的多尺度减法网络  用于医学图像分割:

  • 采用了减法聚合的方法代替传统的加法或串联特征融合,从而提高了特征的有效性和鲁棒性。减法聚合通过对相邻层特征进行差分运算,突出有用的差异信息并消除冗余部分的干扰。
  • 采用了多尺度信息提取的策略,通过金字塔式地连接多个减法单元以获取跨层级别的信息,实现了全方位的多尺度信息互补。此外,通过改进单尺度减法单元,使用具有不同卷积核大小的一组滤波器来实现自然的多尺度减法聚合。
  • 提出了一种名为 LossNet 的智能损失函数,能够从细节到结构地优化特征图的分割结果,提高了分割精度。同时,LossNet 的设计简单且通用,无需复杂的手动数学形式,降低了研究人员的训练难度。

最后,本文还通过四个医学图像分割任务的实验验证了  的有效性,分别是息肉分割、乳腺癌分割、COVID-19 肺感染和 OCT 层分割。此外, 还在 MICCAI 2022 GOALS 国际眼科挑战赛中获得了第二名的好成绩。

方法

概述

图2. SNet

如图2所示, 包括五个编码器块,一个多尺度减法模块 (MMSM) 和四个解码器块。该网络使用 Res2Net-50 作为骨干网络,提取五个级别的特征。首先,对于每个编码器块的特征图,分别采用 3×3 的卷积将通道减少到 64,从而减少后续操作的参数数量。接着,将这些不同层次的特征送入 MMSM 中,输出五个互补增强特征 。最后,每个  逐步参与解码器并生成最终预测。在训练阶段,预测结果和真实值都输入到 LossNet 中进行监督。

多尺度减法模块

图3. multi-scale subtraction unit

的关键在于多尺度子网和多尺度差分模块,它们能够更好地捕捉初始特征图之间的差异信息,从而提高分割精度。

在多尺度差分模块中,本文采用了多尺度卷积滤波器,包括大小为 1×13×35×5 的固定全一权重滤波器。这些滤波器用于计算像素对和区域对的详细结构差异值,能够更好地捕捉结肠息肉的区域特征。与单一尺度的差分模块相比,多尺度差分模块能够提取更多的信息,从而提高模型的准确性。

另外,多尺度子网能够提取高阶互补信息,进一步提高模型的精度。具体来说,首先水平和垂直地连接了多个多尺度差分模块,用于计算具有不同顺序和感受野的一系列差分特征。然后,对每个尺度的特征进行汇聚,生成互补增强特征,最终用于解码和结肠息肉区域的分割。

智能损失函数

图4. LossNet

本文设计了一个总训练损失函数,包括加权的 IoU lossBCE loss,以及一个称为 LossNet 的网络来进一步优化分割细节和结构。

其中,IoU lossBCE loss 在分割任务中被广泛采用并已被验证有效。LossNet 使用一个 ImageNet 预训练分类网络(如VGG-16)提取预测和实际值的多尺度特征,并计算它们之间的特征差异作为损失函数 。

损失  通过像素级别的欧几里得距离 L2 loss 进行监督。该模型可以在特征级别生成全面的监督,低级特征图包含丰富的边界信息,而高级特征图则描绘位置信息。

实验

在5个息肉数据集上与其他 SOTA 方法对比,SNet在关键指标 mDice 上均获得了第一名。

在 COVID-19 CT 和 breast 超声数据集上,SNet 在 Dice 精度也是第一。在 MICCAI 2022 OCT (GOALS) 公开挑战赛中,与100支队伍同台竞争荣获第二名!

可以很直观地看出,SNet 的分割结果在完整度和细腻度上都比其他的模型表现更好,这更充分地证明了 SNet 在医学图像分割领域中的先进性与通用性。

通过逐步增加不同的组件,SNet 性能都获得了进一步的提升

总结

本文提出了一种用于医学图像分割的简单且通用多尺度减法网络 SNet。该方法重新思考以前的加法或串联方法,并基于所提出的层内多尺度减法模块,以金字塔的方式聚合相邻层来提取低阶和高阶跨级互补信息,再结合级别特定信息增强多尺度特征表示。此外,该方法基于 training-free network 设计了一种智能损失函数LossNet,用于监督来自不同级别特征的预测,可以在反向传播期间优化分割的结构和细节。最后,在 11 个基准数据集上进行的 4 个医学分割任务的实验结果表明,本文提出的模型优于各种最先进的方法

目录
相关文章
|
3月前
|
存储 安全 5G
|
3月前
|
机器学习/深度学习 数据可视化 测试技术
YOLO11实战:新颖的多尺度卷积注意力(MSCA)加在网络不同位置的涨点情况 | 创新点如何在自己数据集上高效涨点,解决不涨点掉点等问题
本文探讨了创新点在自定义数据集上表现不稳定的问题,分析了不同数据集和网络位置对创新效果的影响。通过在YOLO11的不同位置引入MSCAAttention模块,展示了三种不同的改进方案及其效果。实验结果显示,改进方案在mAP50指标上分别提升了至0.788、0.792和0.775。建议多尝试不同配置,找到最适合特定数据集的解决方案。
920 0
|
7天前
|
机器学习/深度学习 边缘计算 运维
机器学习在网络安全中的防护:智能化的安全屏障
机器学习在网络安全中的防护:智能化的安全屏障
35 15
|
15天前
|
人工智能 搜索推荐 决策智能
不靠更复杂的策略,仅凭和大模型训练对齐,零样本零经验单LLM调用,成为网络任务智能体新SOTA
近期研究通过调整网络智能体的观察和动作空间,使其与大型语言模型(LLM)的能力对齐,显著提升了基于LLM的网络智能体性能。AgentOccam智能体在WebArena基准上超越了先前方法,成功率提升26.6个点(+161%)。该研究强调了与LLM训练目标一致的重要性,为网络任务自动化提供了新思路,但也指出其性能受限于LLM能力及任务复杂度。论文链接:https://arxiv.org/abs/2410.13825。
47 12
|
17天前
|
数据采集 机器学习/深度学习 人工智能
基于AI的网络流量分析:构建智能化运维体系
基于AI的网络流量分析:构建智能化运维体系
91 13
|
2月前
|
机器学习/深度学习 计算机视觉 网络架构
【YOLO11改进 - C3k2融合】C3k2DWRSeg二次创新C3k2_DWR:扩张式残差分割网络,提高特征提取效率和多尺度信息获取能力,助力小目标检测
【YOLO11改进 - C3k2融合】C3k2DWRSeg二次创新C3k2_DWR:扩张式残差分割网络,提高特征提取效率和多尺度信息获取能力,助力小目DWRSeg是一种高效的实时语义分割网络,通过将多尺度特征提取分为区域残差化和语义残差化两步,提高了特征提取效率。它引入了Dilation-wise Residual (DWR) 和 Simple Inverted Residual (SIR) 模块,优化了不同网络阶段的感受野。在Cityscapes和CamVid数据集上的实验表明,DWRSeg在准确性和推理速度之间取得了最佳平衡,达到了72.7%的mIoU,每秒319.5帧。代码和模型已公开。
【YOLO11改进 - C3k2融合】C3k2DWRSeg二次创新C3k2_DWR:扩张式残差分割网络,提高特征提取效率和多尺度信息获取能力,助力小目标检测
|
2月前
|
机器学习/深度学习 人工智能 物联网
5G与AI融合:智能网络的新纪元
【10月更文挑战第25天】
89 3
|
3月前
|
消息中间件 监控 网络协议
Python中的Socket魔法:如何利用socket模块构建强大的网络通信
本文介绍了Python的`socket`模块,讲解了其基本概念、语法和使用方法。通过简单的TCP服务器和客户端示例,展示了如何创建、绑定、监听、接受连接及发送/接收数据。进一步探讨了多用户聊天室的实现,并介绍了非阻塞IO和多路复用技术以提高并发处理能力。最后,讨论了`socket`模块在现代网络编程中的应用及其与其他通信方式的关系。
363 3
|
2月前
|
机器学习/深度学习 计算机视觉 网络架构
【YOLO11改进 - C3k2融合】C3k2融合DWRSeg二次创新C3k2_DWRSeg:扩张式残差分割网络,提高特征提取效率和多尺度信息获取能力,助力小目标检测
【YOLO11改进 - C3k2融合】C3k2融合DWRSDWRSeg是一种高效的实时语义分割网络,通过将多尺度特征提取方法分解为区域残差化和语义残差化两步,提高了多尺度信息获取的效率。网络设计了Dilation-wise Residual (DWR) 和 Simple Inverted Residual (SIR) 模块,分别用于高阶段和低阶段,以充分利用不同感受野的特征图。实验结果表明,DWRSeg在Cityscapes和CamVid数据集上表现出色,以每秒319.5帧的速度在NVIDIA GeForce GTX 1080 Ti上达到72.7%的mIoU,超越了现有方法。代码和模型已公开。
|
4月前
|
数据采集 Web App开发 开发工具

热门文章

最新文章

下一篇
开通oss服务