【计算机视觉】图像分割中FCN、DeepLab、SegNet、U-Net、Mask R-CNN等算法的讲解(图文解释 超详细)

简介: 【计算机视觉】图像分割中FCN、DeepLab、SegNet、U-Net、Mask R-CNN等算法的讲解(图文解释 超详细)

觉得有帮助请点赞关注收藏~~~

一、FCN分割算法

全卷积神经网络目标分割算法能够端到端的得到每个像素的目标分类结果,与传统的卷积神经网络只能输入固定大小图像和在网络的末端使用几个全连接层得到固定长度的特征向量不同,全卷积神经网络能够接受任意大小尺寸的输入图像,并且网络中没有使用全连接层,而是全部使用卷积层,全卷积神经网络采用反卷积层取代简单的线性插值算法,对最后一个卷积层的特征图进行上采样,使用反卷积可以对卷积进行逆操作

FCN算法采用VGGNet为基础网络,并把VGGNet的最后三层全连接层改为卷积层,最后采用跳跃式结构融合多尺度特征产生与原图大小一致的每个像素图类别图

二、DeepLab图像分割算法

DeepLab图像分割算法主要由两部分所组成:深度卷积神经网络和条件随机场,该方法的主要创新点就是条件随机场部分,该方法的主要创新点就是条件随机场部分,为了能够取得类似于传统条件随机场的全局优化效果,利用循环的方式将上一层的输出作为下一层的输入,其中采用的条件随机场架构是基于全局连接模型,图像分割的条件随机场推理的关键因素就是将类别标号问题转变成概率推理问题。

DeepLab分割算法将条件随机场作为后置的处理加在全卷积神经网络的结果上,用来改善图像分割的结果,这种通过将全卷积神经网络与条件随机场组合得到了较好的结果

三、SegNet图像分割算法

SegNet图像分割算法是一个编码器-解码器结构的卷积神经网络,SegNet算法结果如下图,这是一个对称网络,左边是卷积提取高维特征,卷积后不改变图片大小,通过池化来使图片变小,该部分为编码器部分,右边是反卷积与上采样,上采样使用的使反池化的方式将图像变大,通过反卷积使上采样后的图像信息变得丰富,使得在池化过程丢失的信息可以在学习后得到

SegNet中的池化层多了一个索引的功能,在每次进行最大池化的过程中都会保存滤波器中最大权值的相对位置,在利用反池化的方式进行上采样的时候就能对最大权值的区域信息进行恢复,其余信息则会丢失,因此,SegNet使用可学习的反卷积将缺失的内容进行填充。

四、U-Net算法

U-Net是受到FCN启发针对医学图像做语义分割,且可以利用少量的数据学习到一个对边缘提取十分鲁棒的模型,在生物医学图像分割领域有很大作用,大体由收缩和扩张路径组成,因为形似一个字母U,得名U-Net,收缩路径利用传统卷积神经网络的卷积池化组件,其中经过一次下采样之后从层数变为原来的2倍,扩张路径由2×2的反卷积实现,反卷积的输出通道为原来通道数的一半,与原来的特征图串联,从而得到和原来一样多的通道数的特征图

U-net与其他常见的分割网络有一点非常不同的地方:U-net采用了完全不同的特征融合方式:拼接,U-net采用将特征在层(channel)的维度拼接在一起,形成更厚的特征。而FCN融合时使用的对应点相加,并没有形成更厚的特征。

五、Mask R-CNN算法

它是一个小巧 灵活的通用对象实例分割框架,它不仅可对图像中的目标进行检测,还可以对每一个目标给出一个高质量的图像分割结果,取得了十分不错的结果

如图4-7所示,Mask R-CNN分为两个分支:

(1)第一个分支为原始Faster R-CNN的结构,它用于对候选窗口进行分类和窗口坐标回归。

(2)第二个分支对每一个感兴趣区域(Region of Interest,RoI)预测分割掩模,这个分支采用了图像分割的经典算法-FCN结构。

创作不易 觉得有帮助请点赞关注收藏~~~

相关文章
|
7月前
|
开发框架 算法 搜索推荐
C# .NET面试系列九:常见的算法
#### 1. 求质数 ```c# // 判断一个数是否为质数的方法 public static bool IsPrime(int number) { if (number < 2) { return false; } for (int i = 2; i <= Math.Sqrt(number); i++) { if (number % i == 0) { return false; } } return true; } class Progr
135 1
|
2月前
|
机器学习/深度学习 编解码 算法
【小样本图像分割-4】nnU-Net: Self-adapting Framework for U-Net-Based Medical Image Segmentation
《nnU-Net: 自适应框架用于基于U-Net的医学图像分割》是一篇2018年的论文,发表在Nature上。该研究提出了一种自适应的医学图像分割框架nnU-Net,能够自动调整模型的超参数以适应不同的数据集。通过2D和3D U-Net及级联U-Net的组合,nnU-Net在10个医学分割数据集上取得了卓越的性能,无需手动调整。该方法强调数据增强、预处理和训练策略等技巧,为医学图像分割提供了一个强大的解决方案。
103 0
【小样本图像分割-4】nnU-Net: Self-adapting Framework for U-Net-Based Medical Image Segmentation
|
5月前
|
机器学习/深度学习 人工智能 算法
计算机视觉:目标检测算法综述
【7月更文挑战第13天】目标检测作为计算机视觉领域的重要研究方向,近年来在深度学习技术的推动下取得了显著进展。然而,面对复杂多变的实际应用场景,仍需不断研究和探索更加高效、鲁棒的目标检测算法。随着技术的不断发展和应用场景的不断拓展,相信目标检测算法将在更多领域发挥重要作用。
|
5月前
|
机器学习/深度学习 人工智能 自然语言处理
计算机视觉借助深度学习实现了革命性进步,从图像分类到复杂场景理解,深度学习模型如CNN、RNN重塑了领域边界。
【7月更文挑战第2天】计算机视觉借助深度学习实现了革命性进步,从图像分类到复杂场景理解,深度学习模型如CNN、RNN重塑了领域边界。AlexNet开启新时代,后续模型不断优化,推动对象检测、语义分割、图像生成等领域发展。尽管面临数据隐私、模型解释性等挑战,深度学习已广泛应用于安防、医疗、零售和农业,预示着更智能、高效的未来,同时也强调了技术创新、伦理考量的重要性。
72 1
|
6月前
|
存储 编解码 算法
C#.NET逃逸时间算法生成分形图像的毕业设计完成!晒晒功能
该文介绍了一个使用C#.NET Visual Studio 2008开发的程序,包含错误修复的Julia、Mandelbrot和优化过的Newton三种算法,生成色彩丰富的分形图像。作者改进了原始算法的效率,将内层循环的画点操作移至外部,提升性能。程序提供五种图形模式,支持放大缩小及颜色更新,并允许用户自定义画布大小以调整精度。还具备保存为高质JPG的功能。附有四张示例图片展示生成的分形效果。
|
7月前
|
算法 数据库 计算机视觉
【计算机视觉】FCN、Seg-Net、U-Net模型进行图像分割实战(附源码和数据集 超详细必看)
【计算机视觉】FCN、Seg-Net、U-Net模型进行图像分割实战(附源码和数据集 超详细必看)
291 2
|
7月前
|
算法 C#
C# .Net Core bytes转换为GB/MB/KB 算法
C# .Net Core bytes转换为GB/MB/KB 算法
143 0
|
7月前
|
机器学习/深度学习 文字识别 算法
【Keras计算机视觉OCR】文字识别算法中DenseNet、LSTM、CTC、Attention的讲解(图文解释 超详细)
【Keras计算机视觉OCR】文字识别算法中DenseNet、LSTM、CTC、Attention的讲解(图文解释 超详细)
311 0
|
7月前
|
机器学习/深度学习 文字识别 算法
【Keras计算机视觉OCR文字识别】文字检测算法中CTPN、CRAFT的讲解(图文解释 超详细)
【Keras计算机视觉OCR文字识别】文字检测算法中CTPN、CRAFT的讲解(图文解释 超详细)
250 0
|
7月前
|
机器学习/深度学习 算法 自动驾驶
【计算机视觉】Deep SORT多目标跟踪算法讲解(图文解释 超详细)
【计算机视觉】Deep SORT多目标跟踪算法讲解(图文解释 超详细)
481 0