DL之FCN:FCN算法的简介(论文介绍)、架构详解、案例应用等配图集合之详细攻略

简介: DL之FCN:FCN算法的简介(论文介绍)、架构详解、案例应用等配图集合之详细攻略

FCN算法的简介(论文介绍)


       Faster-RCNN中,曾使用了RPN(Region Proposal Network)替代Selective Search等产生候选区域的方法,其中,RPN就是一种全卷积网络。FCN即Fully Convolutional Networks,该论文将CNN结构应用到图像语义分割领域,并取得突出结果,开山之作,获得CVPR 2015年的best paper honorable mention。


Abstract

     Convolutional networks are powerful visual models that yield hierarchies of features. We show that convolutional networks  by themselves, trained end-to-end, pixels-to-pixels, improve on the previous best result in semantic segmentation. Our key insight is to  build “fully convolutional” networks that take input of arbitrary size and produce correspondingly-sized output with efficient inference  and learning. We define and detail the space of fully convolutional networks, explain their application to spatially dense prediction  tasks, and draw connections to prior models. We adapt contemporary classification networks (AlexNet, the VGG net, and GoogLeNet)  into fully convolutional networks and transfer their learned representations by fine-tuning to the segmentation task. We then define a  skip architecture that combines semantic information from a deep, coarse layer with appearance information from a shallow, fine layer  to produce accurate and detailed segmentations. Our fully convolutional network achieves improved segmentation of PASCAL VOC  (30% relative improvement to 67.2% mean IU on 2012), NYUDv2, SIFT Flow, and PASCAL-Context, while inference takes one tenth of  a second for a typical image.

     卷积网络是一种功能强大的可视化模型,它可以生成特性的层次结构。实验结果表明,卷积网络经过端到端、像素对像素的训练后,在语义分割方面优于已有的最佳分割效果。我们的核心理念是构建“全卷积”网络,它可以接受任意大小的输入,并通过高效的推理和学习产生相应大小的输出。我们定义并详细描述了全卷积网络的空间,解释了它们在空间密集预测任务中的应用,并将它们与之前的模型联系起来。我们将当代的分类网络(AlexNet、VGG net和GoogLeNet)改造成完全卷积的网络,并通过微调将它们的学习表示转移到分割任务中。然后,我们定义了一个skip架构,它结合了来自深度粗层的语义信息和来自深度细层的外观信息,从而生成精确而详细的分段。我们的全卷积网络实现了PASCAL VOC(相对于2012年的67.2% mean IU,提高了30%)、NYUDv2、SIFT Flow和PASCAL- context的分割,而对一个典型图像的推理需要十分之一秒。

CONCLUSION  

     Fully convolutional networks are a rich class of models that  address many pixelwise tasks. FCNs for semantic segmentation  dramatically improve accuracy by transferring pretrained  classifier weights, fusing different layer representations,  and learning end-to-end on whole images. End-toend,  pixel-to-pixel operation simultaneously simplifies and  speeds up learning and inference. All code for this paper is  open source in Caffe, and all models are freely available in  the Caffe Model Zoo. Further works have demonstrated the  generality of fully convolutional networks for a variety of  image-to-image tasks.

     全卷积网络是一类丰富的模型,可以处理许多像素级的任务。FCNs通过传递预先训练的分类器权值,融合不同的层表示,对整个图像进行端到端学习,大大提高了语义分割的精度。端到端,像素对像素的操作同时简化和加快学习和推理。本文的所有代码都是Caffe中的开源代码,所有模型都可以在Caffe Model Zoo中免费获得。进一步的工作证明了全卷积网络对于各种图像到图像任务的通用性。



论文

Jonathan Long, Evan Shelhamer, Trevor Darrell.

Fully Convolutional Networks for Semantic Segmentation. CVPR 2015

https://arxiv.org/abs/1605.06211




0、实验结果


1、FCN的性能

image.png


图像分割的评价指标参考:CV之IS:计算机视觉之图像分割(Image Segmentation)算法的简介、使用方法、案例应用之详细攻略


       FCN的基础CNN网络可以采用AlexNet、VGG16、GoogleNet等经典架构。

      FCN的mean IU是最高的但是foreard time处理时间较长且conv.ayer的复杂度较高。

      比较R-CNN和FCN-8s的测试时间,其中FCN-8s的mean IU高于其他两个网络。


2、跨层改善效果——比较是否采用跨层连接


      第一张图没有采用跨层连接,即no skips(stride=32)分割的FCN,就比较粗糙了;第二张图采用skip=1的跨层连接(stride=16)的FCN有点改善了;第三张图采用skip=2的跨层连接的FCN效果更好一些。



image.png




1、全卷积神经网络的特点、局限性、缺点


1、FCN的特点


image.png


采用1×1卷积,替换全连接层,将CNN网络变成FCN(全卷积网络)。

采用跨层连接,引入底层特征补充上采样信息。

……



2、FCN的局限性


……






FCN算法的架构详解



DL之FCN:FCN算法的架构详解https://yunyaniu.blog.csdn.net/article/details/100060860







相关文章
|
13天前
|
运维 NoSQL Java
后端架构演进:微服务架构的优缺点与实战案例分析
【10月更文挑战第28天】本文探讨了微服务架构与单体架构的优缺点,并通过实战案例分析了微服务架构在实际应用中的表现。微服务架构具有高内聚、低耦合、独立部署等优势,但也面临分布式系统的复杂性和较高的运维成本。通过某电商平台的实际案例,展示了微服务架构在提升系统性能和团队协作效率方面的显著效果,同时也指出了其带来的挑战。
50 4
|
1月前
|
消息中间件 架构师 Cloud Native
软考高级系统架构师论文,到底该怎么写
软考高级系统架构师论文,到底该怎么写
115 0
|
2月前
|
缓存 负载均衡 数据管理
深入探索微服务架构的核心要素与实践策略在当今软件开发领域,微服务架构以其独特的优势和灵活性,已成为众多企业和开发者的首选。本文将深入探讨微服务架构的核心要素,包括服务拆分、通信机制、数据管理等,并结合实际案例分析其在不同场景下的应用策略,旨在为读者提供一套全面、深入的微服务架构实践指南。**
**微服务架构作为软件开发领域的热门话题,正引领着一场技术革新。本文从微服务架构的核心要素出发,详细阐述了服务拆分的原则与方法、通信机制的选择与优化、数据管理的策略与挑战等内容。同时,结合具体案例,分析了微服务架构在不同场景下的应用策略,为读者提供了实用的指导和建议。
|
3月前
|
前端开发 大数据 数据库
🔥大数据洪流下的决战:JSF 表格组件如何做到毫秒级响应?揭秘背后的性能魔法!💪
【8月更文挑战第31天】在 Web 应用中,表格组件常用于展示和操作数据,但在大数据量下性能会成瓶颈。本文介绍在 JavaServer Faces(JSF)中优化表格组件的方法,包括数据处理、分页及懒加载等技术。通过后端分页或懒加载按需加载数据,减少不必要的数据加载和优化数据库查询,并利用缓存机制减少数据库访问次数,从而提高表格组件的响应速度和整体性能。掌握这些最佳实践对开发高性能 JSF 应用至关重要。
67 0
|
3月前
|
存储 设计模式 运维
Angular遇上Azure Functions:探索无服务器架构下的开发实践——从在线投票系统案例深入分析前端与后端的协同工作
【8月更文挑战第31天】在现代软件开发中,无服务器架构因可扩展性和成本效益而备受青睐。本文通过构建一个在线投票应用,介绍如何结合Angular前端框架与Azure Functions后端服务,快速搭建高效、可扩展的应用系统。Angular提供响应式编程和组件化能力,适合构建动态用户界面;Azure Functions则简化了后端逻辑处理与数据存储。通过具体示例代码,详细展示了从设置Azure Functions到整合Angular前端的全过程,帮助开发者轻松上手无服务器应用开发。
27 0
|
3月前
|
机器学习/深度学习 算法 网络架构
神经网络架构殊途同归?ICML 2024论文:模型不同,但学习内容相同
【8月更文挑战第3天】《神经语言模型的缩放定律》由OpenAI研究人员完成并在ICML 2024发表。研究揭示了模型性能与大小、数据集及计算资源间的幂律关系,表明增大任一资源均可预测地提升性能。此外,论文指出模型宽度与深度对性能影响较小,较大模型在更多数据上训练能更好泛化,且能高效利用计算资源。研究提供了训练策略建议,对于神经语言模型优化意义重大,但也存在局限性,需进一步探索。论文链接:[https://arxiv.org/abs/2001.08361]。
45 1
|
22天前
|
算法 安全 数据安全/隐私保护
基于game-based算法的动态频谱访问matlab仿真
本算法展示了在认知无线电网络中,通过游戏理论优化动态频谱访问,提高频谱利用率和物理层安全性。程序运行效果包括负载因子、传输功率、信噪比对用户效用和保密率的影响分析。软件版本:Matlab 2022a。完整代码包含详细中文注释和操作视频。
|
7天前
|
算法 数据挖掘 数据安全/隐私保护
基于FCM模糊聚类算法的图像分割matlab仿真
本项目展示了基于模糊C均值(FCM)算法的图像分割技术。算法运行效果良好,无水印。使用MATLAB 2022a开发,提供完整代码及中文注释,附带操作步骤视频。FCM算法通过隶属度矩阵和聚类中心矩阵实现图像分割,适用于灰度和彩色图像,广泛应用于医学影像、遥感图像等领域。
|
8天前
|
算法 调度
基于遗传模拟退火混合优化算法的车间作业最优调度matlab仿真,输出甘特图
车间作业调度问题(JSSP)通过遗传算法(GA)和模拟退火算法(SA)优化多个作业在并行工作中心上的加工顺序和时间,以最小化总完成时间和机器闲置时间。MATLAB2022a版本运行测试,展示了有效性和可行性。核心程序采用作业列表表示法,结合遗传操作和模拟退火过程,提高算法性能。
|
9天前
|
存储 算法 决策智能
基于免疫算法的TSP问题求解matlab仿真
旅行商问题(TSP)是一个经典的组合优化问题,目标是寻找经过每个城市恰好一次并返回起点的最短回路。本文介绍了一种基于免疫算法(IA)的解决方案,该算法模拟生物免疫系统的运作机制,通过克隆选择、变异和免疫记忆等步骤,有效解决了TSP问题。程序使用MATLAB 2022a版本运行,展示了良好的优化效果。