DL之FCN:FCN算法的简介(论文介绍)、架构详解、案例应用等配图集合之详细攻略

简介: DL之FCN:FCN算法的简介(论文介绍)、架构详解、案例应用等配图集合之详细攻略

FCN算法的简介(论文介绍)


       Faster-RCNN中,曾使用了RPN(Region Proposal Network)替代Selective Search等产生候选区域的方法,其中,RPN就是一种全卷积网络。FCN即Fully Convolutional Networks,该论文将CNN结构应用到图像语义分割领域,并取得突出结果,开山之作,获得CVPR 2015年的best paper honorable mention。


Abstract

     Convolutional networks are powerful visual models that yield hierarchies of features. We show that convolutional networks  by themselves, trained end-to-end, pixels-to-pixels, improve on the previous best result in semantic segmentation. Our key insight is to  build “fully convolutional” networks that take input of arbitrary size and produce correspondingly-sized output with efficient inference  and learning. We define and detail the space of fully convolutional networks, explain their application to spatially dense prediction  tasks, and draw connections to prior models. We adapt contemporary classification networks (AlexNet, the VGG net, and GoogLeNet)  into fully convolutional networks and transfer their learned representations by fine-tuning to the segmentation task. We then define a  skip architecture that combines semantic information from a deep, coarse layer with appearance information from a shallow, fine layer  to produce accurate and detailed segmentations. Our fully convolutional network achieves improved segmentation of PASCAL VOC  (30% relative improvement to 67.2% mean IU on 2012), NYUDv2, SIFT Flow, and PASCAL-Context, while inference takes one tenth of  a second for a typical image.

     卷积网络是一种功能强大的可视化模型,它可以生成特性的层次结构。实验结果表明,卷积网络经过端到端、像素对像素的训练后,在语义分割方面优于已有的最佳分割效果。我们的核心理念是构建“全卷积”网络,它可以接受任意大小的输入,并通过高效的推理和学习产生相应大小的输出。我们定义并详细描述了全卷积网络的空间,解释了它们在空间密集预测任务中的应用,并将它们与之前的模型联系起来。我们将当代的分类网络(AlexNet、VGG net和GoogLeNet)改造成完全卷积的网络,并通过微调将它们的学习表示转移到分割任务中。然后,我们定义了一个skip架构,它结合了来自深度粗层的语义信息和来自深度细层的外观信息,从而生成精确而详细的分段。我们的全卷积网络实现了PASCAL VOC(相对于2012年的67.2% mean IU,提高了30%)、NYUDv2、SIFT Flow和PASCAL- context的分割,而对一个典型图像的推理需要十分之一秒。

CONCLUSION  

     Fully convolutional networks are a rich class of models that  address many pixelwise tasks. FCNs for semantic segmentation  dramatically improve accuracy by transferring pretrained  classifier weights, fusing different layer representations,  and learning end-to-end on whole images. End-toend,  pixel-to-pixel operation simultaneously simplifies and  speeds up learning and inference. All code for this paper is  open source in Caffe, and all models are freely available in  the Caffe Model Zoo. Further works have demonstrated the  generality of fully convolutional networks for a variety of  image-to-image tasks.

     全卷积网络是一类丰富的模型,可以处理许多像素级的任务。FCNs通过传递预先训练的分类器权值,融合不同的层表示,对整个图像进行端到端学习,大大提高了语义分割的精度。端到端,像素对像素的操作同时简化和加快学习和推理。本文的所有代码都是Caffe中的开源代码,所有模型都可以在Caffe Model Zoo中免费获得。进一步的工作证明了全卷积网络对于各种图像到图像任务的通用性。



论文

Jonathan Long, Evan Shelhamer, Trevor Darrell.

Fully Convolutional Networks for Semantic Segmentation. CVPR 2015

https://arxiv.org/abs/1605.06211




0、实验结果


1、FCN的性能

image.png


图像分割的评价指标参考:CV之IS:计算机视觉之图像分割(Image Segmentation)算法的简介、使用方法、案例应用之详细攻略


       FCN的基础CNN网络可以采用AlexNet、VGG16、GoogleNet等经典架构。

      FCN的mean IU是最高的但是foreard time处理时间较长且conv.ayer的复杂度较高。

      比较R-CNN和FCN-8s的测试时间,其中FCN-8s的mean IU高于其他两个网络。


2、跨层改善效果——比较是否采用跨层连接


      第一张图没有采用跨层连接,即no skips(stride=32)分割的FCN,就比较粗糙了;第二张图采用skip=1的跨层连接(stride=16)的FCN有点改善了;第三张图采用skip=2的跨层连接的FCN效果更好一些。



image.png




1、全卷积神经网络的特点、局限性、缺点


1、FCN的特点


image.png


采用1×1卷积,替换全连接层,将CNN网络变成FCN(全卷积网络)。

采用跨层连接,引入底层特征补充上采样信息。

……



2、FCN的局限性


……






FCN算法的架构详解



DL之FCN:FCN算法的架构详解https://yunyaniu.blog.csdn.net/article/details/100060860







相关文章
|
14天前
|
数据采集 机器学习/深度学习 算法
|
30天前
|
数据采集 机器学习/深度学习 算法
【优秀设计案例】基于K-Means聚类算法的球员数据聚类分析设计与实现
本文通过K-Means聚类算法对NBA球员数据进行聚类分析,旨在揭示球员间的相似性和差异性,为球队管理、战术决策和球员评估提供数据支持,并通过特征工程和结果可视化深入理解球员表现和潜力。
【优秀设计案例】基于K-Means聚类算法的球员数据聚类分析设计与实现
|
30天前
|
搜索推荐 前端开发 数据可视化
【优秀python web毕设案例】基于协同过滤算法的酒店推荐系统,django框架+bootstrap前端+echarts可视化,有后台有爬虫
本文介绍了一个基于Django框架、协同过滤算法、ECharts数据可视化以及Bootstrap前端技术的酒店推荐系统,该系统通过用户行为分析和推荐算法优化,提供个性化的酒店推荐和直观的数据展示,以提升用户体验。
|
21天前
|
机器学习/深度学习 人工智能 算法
【人工智能】传统语音识别算法概述,应用场景,项目实践及案例分析,附带代码示例
传统语音识别算法是将语音信号转化为文本形式的技术,它主要基于模式识别理论和数学统计学方法。以下是传统语音识别算法的基本概述
36 2
|
22天前
|
机器学习/深度学习 算法 数据可视化
决策树算法介绍:原理与案例实现
决策树算法介绍:原理与案例实现
|
30天前
|
算法
突击面试:解密面试官的算法题集合
突击面试:解密面试官的算法题集合
|
2月前
|
算法
Raid5数据恢复—Raid5算法简介&raid5磁盘阵列数据恢复案例
Raid5算法也被称为“异或运算”。异或是一个数学运算符,它应用于逻辑运算。异或的数学符号为“⊕”,计算机符号为“xor”。异或的运算法则为:a⊕b = (¬a ∧ b) ∨ (a ∧¬b)。如果a、b两个值不相同,则异或结果为1。如果a、b两个值相同,异或结果为0。 异或也叫半加运算,其运算法则相当于不带进位的二进制加法。二进制下用1表示真,0表示假。异或的运算法则为:0⊕0=0,1⊕0=1,0⊕1=1,1⊕1=0(同为0,异为1),这些法则与加法是相同的,只是不带进位。 异或略称为XOR、EOR、EX-OR,程序中有三种演算子:XOR、xor、⊕。使用方法如下z = x ⊕ y z
Raid5数据恢复—Raid5算法简介&raid5磁盘阵列数据恢复案例
|
2月前
|
算法 搜索推荐 编译器
算法高手养成记:Python快速排序的深度优化与实战案例分析
【7月更文挑战第11天】快速排序是编程基础,以O(n log n)时间复杂度和原址排序著称。其核心是“分而治之”,通过选择基准元素分割数组并递归排序两部分。优化包括:选择中位数作基准、尾递归优化、小数组用简单排序。以下是一个考虑优化的Python实现片段,展示了随机基准选择。通过实践和优化,能提升算法技能。**
37 3
|
2月前
|
机器学习/深度学习 数据采集 算法
【机器学习】CART决策树算法的核心思想及其大数据时代银行贷款参考案例——机器认知外界的重要算法
【机器学习】CART决策树算法的核心思想及其大数据时代银行贷款参考案例——机器认知外界的重要算法
|
3月前
|
算法 Java
Java数据结构与算法:用于处理不相交集合的合并和查找问题
Java数据结构与算法:用于处理不相交集合的合并和查找问题
下一篇
DDNS