DL之FCN:FCN算法的简介(论文介绍)、架构详解、案例应用等配图集合之详细攻略

简介: DL之FCN:FCN算法的简介(论文介绍)、架构详解、案例应用等配图集合之详细攻略

FCN算法的简介(论文介绍)


       Faster-RCNN中,曾使用了RPN(Region Proposal Network)替代Selective Search等产生候选区域的方法,其中,RPN就是一种全卷积网络。FCN即Fully Convolutional Networks,该论文将CNN结构应用到图像语义分割领域,并取得突出结果,开山之作,获得CVPR 2015年的best paper honorable mention。


Abstract

     Convolutional networks are powerful visual models that yield hierarchies of features. We show that convolutional networks  by themselves, trained end-to-end, pixels-to-pixels, improve on the previous best result in semantic segmentation. Our key insight is to  build “fully convolutional” networks that take input of arbitrary size and produce correspondingly-sized output with efficient inference  and learning. We define and detail the space of fully convolutional networks, explain their application to spatially dense prediction  tasks, and draw connections to prior models. We adapt contemporary classification networks (AlexNet, the VGG net, and GoogLeNet)  into fully convolutional networks and transfer their learned representations by fine-tuning to the segmentation task. We then define a  skip architecture that combines semantic information from a deep, coarse layer with appearance information from a shallow, fine layer  to produce accurate and detailed segmentations. Our fully convolutional network achieves improved segmentation of PASCAL VOC  (30% relative improvement to 67.2% mean IU on 2012), NYUDv2, SIFT Flow, and PASCAL-Context, while inference takes one tenth of  a second for a typical image.

     卷积网络是一种功能强大的可视化模型,它可以生成特性的层次结构。实验结果表明,卷积网络经过端到端、像素对像素的训练后,在语义分割方面优于已有的最佳分割效果。我们的核心理念是构建“全卷积”网络,它可以接受任意大小的输入,并通过高效的推理和学习产生相应大小的输出。我们定义并详细描述了全卷积网络的空间,解释了它们在空间密集预测任务中的应用,并将它们与之前的模型联系起来。我们将当代的分类网络(AlexNet、VGG net和GoogLeNet)改造成完全卷积的网络,并通过微调将它们的学习表示转移到分割任务中。然后,我们定义了一个skip架构,它结合了来自深度粗层的语义信息和来自深度细层的外观信息,从而生成精确而详细的分段。我们的全卷积网络实现了PASCAL VOC(相对于2012年的67.2% mean IU,提高了30%)、NYUDv2、SIFT Flow和PASCAL- context的分割,而对一个典型图像的推理需要十分之一秒。

CONCLUSION  

     Fully convolutional networks are a rich class of models that  address many pixelwise tasks. FCNs for semantic segmentation  dramatically improve accuracy by transferring pretrained  classifier weights, fusing different layer representations,  and learning end-to-end on whole images. End-toend,  pixel-to-pixel operation simultaneously simplifies and  speeds up learning and inference. All code for this paper is  open source in Caffe, and all models are freely available in  the Caffe Model Zoo. Further works have demonstrated the  generality of fully convolutional networks for a variety of  image-to-image tasks.

     全卷积网络是一类丰富的模型,可以处理许多像素级的任务。FCNs通过传递预先训练的分类器权值,融合不同的层表示,对整个图像进行端到端学习,大大提高了语义分割的精度。端到端,像素对像素的操作同时简化和加快学习和推理。本文的所有代码都是Caffe中的开源代码,所有模型都可以在Caffe Model Zoo中免费获得。进一步的工作证明了全卷积网络对于各种图像到图像任务的通用性。



论文

Jonathan Long, Evan Shelhamer, Trevor Darrell.

Fully Convolutional Networks for Semantic Segmentation. CVPR 2015

https://arxiv.org/abs/1605.06211




0、实验结果


1、FCN的性能

image.png


图像分割的评价指标参考:CV之IS:计算机视觉之图像分割(Image Segmentation)算法的简介、使用方法、案例应用之详细攻略


       FCN的基础CNN网络可以采用AlexNet、VGG16、GoogleNet等经典架构。

      FCN的mean IU是最高的但是foreard time处理时间较长且conv.ayer的复杂度较高。

      比较R-CNN和FCN-8s的测试时间,其中FCN-8s的mean IU高于其他两个网络。


2、跨层改善效果——比较是否采用跨层连接


      第一张图没有采用跨层连接,即no skips(stride=32)分割的FCN,就比较粗糙了;第二张图采用skip=1的跨层连接(stride=16)的FCN有点改善了;第三张图采用skip=2的跨层连接的FCN效果更好一些。



image.png




1、全卷积神经网络的特点、局限性、缺点


1、FCN的特点


image.png


采用1×1卷积,替换全连接层,将CNN网络变成FCN(全卷积网络)。

采用跨层连接,引入底层特征补充上采样信息。

……



2、FCN的局限性


……






FCN算法的架构详解



DL之FCN:FCN算法的架构详解https://yunyaniu.blog.csdn.net/article/details/100060860







目录
打赏
0
0
0
0
1042
分享
相关文章
公司监控上网软件架构:基于 C++ 链表算法的数据关联机制探讨
在数字化办公时代,公司监控上网软件成为企业管理网络资源和保障信息安全的关键工具。本文深入剖析C++中的链表数据结构及其在该软件中的应用。链表通过节点存储网络访问记录,具备高效插入、删除操作及节省内存的优势,助力企业实时追踪员工上网行为,提升运营效率并降低安全风险。示例代码展示了如何用C++实现链表记录上网行为,并模拟发送至服务器。链表为公司监控上网软件提供了灵活高效的数据管理方式,但实际开发还需考虑安全性、隐私保护等多方面因素。
11 0
公司监控上网软件架构:基于 C++ 链表算法的数据关联机制探讨
架构学习:7种负载均衡算法策略
四层负载均衡包括数据链路层、网络层和应用层负载均衡。数据链路层通过修改MAC地址转发帧;网络层通过改变IP地址实现数据包转发;应用层有多种策略,如轮循、权重轮循、随机、权重随机、一致性哈希、响应速度和最少连接数均衡,确保请求合理分配到服务器,提升性能与稳定性。
301 11
架构学习:7种负载均衡算法策略
深度强化学习中SAC算法:数学原理、网络架构及其PyTorch实现
软演员-评论家算法(Soft Actor-Critic, SAC)是深度强化学习领域的重要进展,基于最大熵框架优化策略,在探索与利用之间实现动态平衡。SAC通过双Q网络设计和自适应温度参数,提升了训练稳定性和样本效率。本文详细解析了SAC的数学原理、网络架构及PyTorch实现,涵盖演员网络的动作采样与对数概率计算、评论家网络的Q值估计及其损失函数,并介绍了完整的SAC智能体实现流程。SAC在连续动作空间中表现出色,具有高样本效率和稳定的训练过程,适合实际应用场景。
273 7
深度强化学习中SAC算法:数学原理、网络架构及其PyTorch实现
婚恋交友系统平台 相亲交友平台系统 婚恋交友系统APP 婚恋系统源码 婚恋交友平台开发流程 婚恋交友系统架构设计 婚恋交友系统前端/后端开发 婚恋交友系统匹配推荐算法优化
婚恋交友系统平台通过线上互动帮助单身男女找到合适伴侣,提供用户注册、个人资料填写、匹配推荐、实时聊天、社区互动等功能。开发流程包括需求分析、技术选型、系统架构设计、功能实现、测试优化和上线运维。匹配推荐算法优化是核心,通过用户行为数据分析和机器学习提高匹配准确性。
200 3
分布式系统架构1:共识算法Paxos
本文介绍了分布式系统中实现数据一致性的重要算法——Paxos及其改进版Multi Paxos。Paxos算法由Leslie Lamport提出,旨在解决分布式环境下的共识问题,通过提案节点、决策节点和记录节点的协作,确保数据在多台机器间的一致性和可用性。Multi Paxos通过引入主节点选举机制,优化了基本Paxos的效率,减少了网络通信次数,提高了系统的性能和可靠性。文中还简要讨论了数据复制的安全性和一致性保障措施。
132 1
后端架构演进:微服务架构的优缺点与实战案例分析
【10月更文挑战第28天】本文探讨了微服务架构与单体架构的优缺点,并通过实战案例分析了微服务架构在实际应用中的表现。微服务架构具有高内聚、低耦合、独立部署等优势,但也面临分布式系统的复杂性和较高的运维成本。通过某电商平台的实际案例,展示了微服务架构在提升系统性能和团队协作效率方面的显著效果,同时也指出了其带来的挑战。
129 4
国密加密算法简介
国密指国家密码局认定的国产密码算法,主要包括SM1、SM2、SM3、SM4等,并持续完善。SM1是对称加密算法,加密强度与AES相当,需加密芯片支持;SM2是非对称加密,基于ECC算法,签名和密钥生成速度优于RSA;SM3为杂凑算法,安全性高于MD5;SM4为对称加密算法,用于无线局域网标准。本文提供使用Java和SpringBoot实现SM2和SM4加密的示例代码及依赖配置。更多国密算法标准可参考国家密码局官网。
647 1
ArrayList简介及使用全方位手把手教学(带源码),用ArrayList实现洗牌算法,3个人轮流拿牌(带全部源码)
文章全面介绍了Java中ArrayList的使用方法,包括其构造方法、常见操作、遍历方式、扩容机制,并展示了如何使用ArrayList实现洗牌算法的实例。
40 0
深入探索微服务架构的核心要素与实践策略在当今软件开发领域,微服务架构以其独特的优势和灵活性,已成为众多企业和开发者的首选。本文将深入探讨微服务架构的核心要素,包括服务拆分、通信机制、数据管理等,并结合实际案例分析其在不同场景下的应用策略,旨在为读者提供一套全面、深入的微服务架构实践指南。**
**微服务架构作为软件开发领域的热门话题,正引领着一场技术革新。本文从微服务架构的核心要素出发,详细阐述了服务拆分的原则与方法、通信机制的选择与优化、数据管理的策略与挑战等内容。同时,结合具体案例,分析了微服务架构在不同场景下的应用策略,为读者提供了实用的指导和建议。
🔥大数据洪流下的决战:JSF 表格组件如何做到毫秒级响应?揭秘背后的性能魔法!💪
【8月更文挑战第31天】在 Web 应用中,表格组件常用于展示和操作数据,但在大数据量下性能会成瓶颈。本文介绍在 JavaServer Faces(JSF)中优化表格组件的方法,包括数据处理、分页及懒加载等技术。通过后端分页或懒加载按需加载数据,减少不必要的数据加载和优化数据库查询,并利用缓存机制减少数据库访问次数,从而提高表格组件的响应速度和整体性能。掌握这些最佳实践对开发高性能 JSF 应用至关重要。
92 0

热门文章

最新文章