UNet详细解读(一)论文技术要点归纳

简介: UNet详细解读(一)论文技术要点归纳

UNet


摘要


2015年诞生,获得当年的ISBI细胞追踪挑战比赛第一名,在GPU上推理512x512的图像不到1秒钟,开创图像分割的先河。


简介


在当时,卷积神经网络是主流,但是仅限于图像分类任务,并且需要大量的数据集。对于医学图像,数据集的量很少。

2012年 Ciresan提出的网络虽然获得了EM的第一名,但是有缺陷,因此作者提出了UNet,解决了这些问题。并且远远超出了之前的所有分割网络。


Over-tile策略

1.png

对图中黄色部分像素点进行预测的时候,需要用到蓝色部分的上下文信息,但是这么做会出现两个问题。


1.边界问题:进行镜像扩充。


2.重叠问题:在卷积时只使用有效部分,在卷积的时候会使用到蓝色部分,但是传入到下一层的只有黄色部分。


网络架构

2.png

左侧为收缩路径,由3X3卷积、Relu、最大池化组成,每次下采样后通道数量加倍,用于获取上下文信息。


右侧为扩展路径,由3X3卷积、Relu、2X2上采样组成,每次下采样后通道数量减半,用于精确定位。


输入是572x572的,但是输出变成了388x388,这说明经过网络以后,输出的结果和原图不是完全对应的,这在计算loss和输出结果都可以得到体现.


蓝色箭头代表3x3的卷积操作,并且步长是1,不进行padding,因此,每个该操作以后,featuremap的大小会减2.


红色箭头代表2x2的最大池化操作.如果池化之前特征向量的大小是奇数,那么就会损失一些信息 。输入的大小最好满足一个条件,就是可以让每一层池化操作前的特征向量的大小是偶数,这样就不会损失一些信息,并且crop的时候不会产生误差.


绿色箭头代表2x2的反卷积操作.何为反卷积会在后面进行记录


灰色箭头表示复制和剪切操作.


输出的最后一层,使用了1x1的卷积层做了分类


前半部分也就是图中左边部分的作用是特征提取,后半部分也就是图中的右边部分是上采样,也叫 encoder-deconder结构


训练


采用SGD优化器,动量设置为0.99,使用单张图片训练,使用了加权重的softmax损失函数,使得每个像素有自己的权重,也就是做了w*h个softmax。

3.png


数据增强


主要使用了旋转平移不变性、弹性形变和dropout。


小结


Unet是一个分割网络,主要提出了两个策略:


第一个是overlap-tile策略,解决了边缘区域没有上下文的问题;


第二个是使用了加权损失以使得网络更加重视边缘像素的学习。

目录
相关文章
|
16天前
|
机器学习/深度学习 算法 网络架构
神经网络架构殊途同归?ICML 2024论文:模型不同,但学习内容相同
【8月更文挑战第3天】《神经语言模型的缩放定律》由OpenAI研究人员完成并在ICML 2024发表。研究揭示了模型性能与大小、数据集及计算资源间的幂律关系,表明增大任一资源均可预测地提升性能。此外,论文指出模型宽度与深度对性能影响较小,较大模型在更多数据上训练能更好泛化,且能高效利用计算资源。研究提供了训练策略建议,对于神经语言模型优化意义重大,但也存在局限性,需进一步探索。论文链接:[https://arxiv.org/abs/2001.08361]。
17 1
|
3月前
|
机器学习/深度学习 数据可视化 计算机视觉
【YOLOv8改进】MCA:用于图像识别的深度卷积神经网络中的多维协作注意力 (论文笔记+引入代码)
YOLO目标检测专栏介绍了YOLO的创新改进和实战案例,包括多维协作注意力(MCA)机制,它通过三分支架构同时处理通道、高度和宽度注意力,提高CNN性能。MCA设计了自适应组合和门控机制,增强特征表示,且保持轻量化。该模块适用于各种CNN,实验证明其在图像识别任务上的优越性。此外,文章还展示了如何在YOLOv8中引入MCA层的代码实现和相关任务配置。
|
机器学习/深度学习 编解码 算法框架/工具
经典神经网络论文超详细解读(八)——ResNeXt学习笔记(翻译+精读+代码复现)
经典神经网络论文超详细解读(八)——ResNeXt学习笔记(翻译+精读+代码复现)
423 1
经典神经网络论文超详细解读(八)——ResNeXt学习笔记(翻译+精读+代码复现)
|
机器学习/深度学习 Web App开发 数据挖掘
经典神经网络论文超详细解读(七)——SENet(注意力机制)学习笔记(翻译+精读+代码复现)
经典神经网络论文超详细解读(七)——SENet(注意力机制)学习笔记(翻译+精读+代码复现)
2006 1
经典神经网络论文超详细解读(七)——SENet(注意力机制)学习笔记(翻译+精读+代码复现)
|
12月前
|
机器学习/深度学习 计算机视觉
深度学习原理篇 第七章:Deformable DETR
简要介绍Deformable DETR的原理和代码实现。
932 1
|
12月前
|
机器学习/深度学习 资源调度 算法
深度学习原理篇 第六章:DETR
简要介绍DETR的原理和代码实现。
450 0
|
11月前
|
机器学习/深度学习 数据采集 人工智能
头疼!卷积神经网络是什么?CNN结构、训练与优化一文全解
头疼!卷积神经网络是什么?CNN结构、训练与优化一文全解
75 0
|
机器学习/深度学习 人工智能 算法
【ICLR 2018】模型集成的TRPO算法【附代码】
【ICLR 2018】模型集成的TRPO算法【附代码】
|
网络架构 计算机视觉
UNet++详细解读(一)论文技术要点归纳
UNet++详细解读(一)论文技术要点归纳
283 0
|
机器学习/深度学习 算法 文件存储
YOLOV7详细解读(三)技术要点归纳
YOLOV7详细解读(三)技术要点归纳
792 0