UNet详细解读(一)论文技术要点归纳

简介: UNet详细解读(一)论文技术要点归纳

UNet


摘要


2015年诞生,获得当年的ISBI细胞追踪挑战比赛第一名,在GPU上推理512x512的图像不到1秒钟,开创图像分割的先河。


简介


在当时,卷积神经网络是主流,但是仅限于图像分类任务,并且需要大量的数据集。对于医学图像,数据集的量很少。

2012年 Ciresan提出的网络虽然获得了EM的第一名,但是有缺陷,因此作者提出了UNet,解决了这些问题。并且远远超出了之前的所有分割网络。


Over-tile策略

1.png

对图中黄色部分像素点进行预测的时候,需要用到蓝色部分的上下文信息,但是这么做会出现两个问题。


1.边界问题:进行镜像扩充。


2.重叠问题:在卷积时只使用有效部分,在卷积的时候会使用到蓝色部分,但是传入到下一层的只有黄色部分。


网络架构

2.png

左侧为收缩路径,由3X3卷积、Relu、最大池化组成,每次下采样后通道数量加倍,用于获取上下文信息。


右侧为扩展路径,由3X3卷积、Relu、2X2上采样组成,每次下采样后通道数量减半,用于精确定位。


输入是572x572的,但是输出变成了388x388,这说明经过网络以后,输出的结果和原图不是完全对应的,这在计算loss和输出结果都可以得到体现.


蓝色箭头代表3x3的卷积操作,并且步长是1,不进行padding,因此,每个该操作以后,featuremap的大小会减2.


红色箭头代表2x2的最大池化操作.如果池化之前特征向量的大小是奇数,那么就会损失一些信息 。输入的大小最好满足一个条件,就是可以让每一层池化操作前的特征向量的大小是偶数,这样就不会损失一些信息,并且crop的时候不会产生误差.


绿色箭头代表2x2的反卷积操作.何为反卷积会在后面进行记录


灰色箭头表示复制和剪切操作.


输出的最后一层,使用了1x1的卷积层做了分类


前半部分也就是图中左边部分的作用是特征提取,后半部分也就是图中的右边部分是上采样,也叫 encoder-deconder结构


训练


采用SGD优化器,动量设置为0.99,使用单张图片训练,使用了加权重的softmax损失函数,使得每个像素有自己的权重,也就是做了w*h个softmax。

3.png


数据增强


主要使用了旋转平移不变性、弹性形变和dropout。


小结


Unet是一个分割网络,主要提出了两个策略:


第一个是overlap-tile策略,解决了边缘区域没有上下文的问题;


第二个是使用了加权损失以使得网络更加重视边缘像素的学习。

目录
相关文章
|
3月前
|
弹性计算 Linux API
真·喂饭级教程:1分钟阿里云ECS/本地部署OpenClaw +配置免费 API 及 Skill 集成和避坑指南
2026年,开源AI代理工具OpenClaw(前身为Clawdbot、Moltbot)持续升温,凭借“自然语言驱动、多技能集成、零编程门槛”的核心特性,成为个人与轻量团队解锁自动化办公、开发辅助的核心工具,圈内俗称“养龙虾”——它就像一个可定制的专属数字员工,无需手动编写代码,仅需输入口语化指令,就能自动完成文档处理、代码生成、网络查询、跨平台协同等重复性任务,彻底解放双手、提升效率。
1162 5
|
NoSQL Shell 应用服务中间件
Dockerfile详解及优化技巧
Dockerfile详解及优化技巧
这一篇让你彻底搞懂贝塞尔曲线
贝塞尔曲线不懂画?不知道怎么回事?看这一篇就够了!用图形,点曲线运动图和公式推导,让你彻底搞懂贝塞尔曲线的运行原理!
4611 0
这一篇让你彻底搞懂贝塞尔曲线
|
机器学习/深度学习 人工智能 调度
高效评估多模态预训练对齐质量,中科大提出模态融合率MIR
中国科学技术大学研究团队提出了一种新的评估指标——模态融合率(MIR),用于评估多模态预训练模型的对齐质量。MIR通过衡量不同模态之间的分布距离,有效反映了模型的对齐质量,并在多种训练配置下表现出良好的鲁棒性和通用性。实验结果表明,MIR能够准确评估训练数据选择、训练策略调度和模型架构设计对预训练结果的影响,为多模态学习提供了可靠的方法。
683 22
|
机器学习/深度学习 数据可视化 算法
【2023美赛】C题Wordle预测27页中文论文及Python代码详解
本文提供了2023年美赛C题Wordle预测的27页中文论文及Python代码的详细解读,涵盖了时间序列预测、特征工程、模型选择与评估、聚类分析等多个方面,并提供了相关数据和代码的下载方式。
798 3
|
JavaScript 安全 前端开发
关于Node.js,一定要学这个10+万Star项目 !!
一篇关于Node.js的宝藏项目——Node.js Best Practices。该项目在GitHub上已有102k Star,汇集了100+条最佳实践,涵盖架构、安全、性能等多方面。每条实践不仅有简明说明和详细解释,还附带代码示例及资源链接。文中通过三个实战案例(利用CPU多核、避免阻塞事件循环、使用中间件处理错误)展示了其实际应用价值,并推荐了几条对前端转Node.js开发者特别有用的最佳实践。强烈建议每位Node.js开发者学习此项目,理解“怎么做”与“为什么要这么做”,以提升开发能力。
472 3
ENVI_IDL:如何读取HDF4文件和HDF5文件的数据集和属性?
参考Documentation Center (l3harrisgeospatial.com) 由于时间和精力,这里并没有对其中的函数进行详细的说明,只是介绍了函数作用以及用法。
591 0
|
机器学习/深度学习 存储 人工智能
基于NumPy构建LSTM模块并进行实例应用(附代码)
基于NumPy构建LSTM模块并进行实例应用(附代码)
759 0
|
机器学习/深度学习 数据采集 算法
机器学习-特征选择:如何使用Lassco回归精确选择最佳特征?
本文旨在介绍Lasso回归在精确特征选择中的应用。首先,我们将探讨特征选择的重要性,包括如何提高模型性能和降低计算成本。接着,我们将深入解析Lasso回归的原理和算法,并说明其在特征选择中的优势。为了支撑我们的观点,我们将引用相关文献提供的实证结果和案例分析。
3391 1
|
机器学习/深度学习 编解码
UNet介绍及其相关思考
UNet介绍及其相关思考