DL之RefineNet:RefineNet和Light-Weight RefineNet算法的简介(论文介绍)、架构详解、案例应用等配图集合之详细攻略

简介: DL之RefineNet:RefineNet和Light-Weight RefineNet算法的简介(论文介绍)、架构详解、案例应用等配图集合之详细攻略

RefineNet和Light-Weight RefineNet算法的简介(论文介绍)



RefineNet


Abstract  

      Recently, very deep convolutional neural networks  (CNNs) have shown outstanding performance in object  recognition and have also been the first choice for dense  classification problems such as semantic segmentation.  However, repeated subsampling operations like pooling or  convolution striding in deep CNNs lead to a significant decrease  in the initial image resolution. Here, we present  RefineNet, a generic multi-path refinement network that  explicitly exploits all the information available along the  down-sampling process to enable high-resolution prediction  using long-range residual connections. In this way,  the deeper layers that capture high-level semantic features  can be directly refined using fine-grained features from earlier  convolutions. The individual components of RefineNet  employ residual connections following the identity mapping  mindset, which allows for effective end-to-end training.  Further, we introduce chained residual pooling, which  captures rich background context in an efficient manner. We  carry out comprehensive experiments and set new stateof-the-art  results on seven public datasets. In particular,  we achieve an intersection-over-union score of 83.4 on the  challenging PASCAL VOC 2012 dataset, which is the best  reported result to date.

      近年来,深度卷积神经网络(CNNs)在目标识别方面表现出了优异的性能,也成为语义分割等密集分类问题的首选。然而,在深度CNNs中,重复的子采样操作(如池化或卷积跨行)会导致初始图像分辨率显著降低。在这里,我们介绍RefineNet,这是一个通用的多路径优化网络,它显式地利用了下行采样过程中可用的所有信息,从而使用远程剩余连接实现高分辨率预测。通过这种方式,可以使用早期卷积的细粒度特性直接细化捕获高级语义特性的更深层。RefineNet的各个组件使用了遵循身份映射思维的剩余连接,这允许进行有效的端到端训练。此外,我们还引入了链式残差池,它以一种有效的方式捕获了丰富的背景上下文。我们对七个公共数据集进行了全面的实验,并设置了最新的研究结果。特别是,我们在具有挑战性的PASCAL VOC 2012数据集上获得了83.4分的交叉-过度-联合得分,这是迄今为止最好的报告结果。

Conclusion  

      We have presented RefineNet, a novel multi-path refinement  network for semantic segmentation and object parsing.  The cascaded architecture is able to effectively combine  high-level semantics and low-level features to produce  high-resolution segmentation maps. Our design choices  are inspired by the idea of identity mapping which facilitates  gradient propagation across long-range connections  and thus enables effective end-to-end learning. We outperform  all previous works on seven public benchmarks, setting  a new mark for the state of the art in semantic labeling.

      本文提出了一种用于语义分割和对象解析的多路径优化网络RefineNet。级联结构能够有效地结合高级语义和低级特征,生成高分辨率的分割地图。我们的设计选择受到身份映射思想的启发,这种思想促进了跨远程连接的梯度传播,从而实现了有效的端到端学习。在七个公共基准上,我们的表现超过了之前所有的作品,为语义标记的最新水平设定了一个新的标记。


论文

Guosheng Lin, Anton Milan, Chunhua Shen, Ian Reid

RefineNet: Multi-Path Refinement Networks for High-Resolution Semantic Segmentation

https://arxiv.org/abs/1611.06612



Light-Weight RefineNet


           RefineNet轻量化的改进,得到Light-Weight RefineNet算法模型。


Conclusions  

     In this work, we tackled the problem of rethinking an existing semantic segmentation architecture  into the one suitable for real-time performance, while keeping the performance levels  mostly intact. We achieved that by proposing simple modifications to the existing network  and highlighting which building blocks were redundant for the final result. Our method can  be applied along with any classification network for any dataset and can further benefit from  using light-weight backbone networks, and other compression approaches. Quantitatively,  we were able to closely match the performance of the original network while significantly  surpassing its runtime and even acquiring 55 FPS on 512×512 inputs (from initial 20 FPS).  Besides that, we demonstrate that having convolutions with large kernel sizes can be unnecessary  in the decoder part of segmentation networks, and we will devote future work to  further cover this topic.

     在这项工作中,我们解决了将现有的语义分割体系结构重新考虑为适合实时性能的体系结构的问题,同时保持性能级别基本不变。我们通过对现有网络进行简单的修改,并强调哪些构建块对于最终结果是多余的,从而实现了这一点。我们的方法可以应用于任何数据集的任何分类网络,并且可以进一步受益于使用轻量级骨干网络和其他压缩方法。在数量上,我们能够很好地匹配原始网络的性能,同时显著地超过了它的运行时,甚至在512×512的输入(最初的20个FPS)上获得55个FPS。除此之外,我们还证明了在分割网络的解码器部分,使用大内核大小的卷积是不必要的,我们将在以后的工作中进一步讨论这个问题。

Abstract  

     We consider an important task of effective and efficient semantic image segmentation.  In particular, we adapt a powerful semantic segmentation architecture, called  RefineNet [46], into the more compact one, suitable even for tasks requiring real-time  performance on high-resolution inputs. To this end, we identify computationally expensive  blocks in the original setup, and propose two modifications aimed to decrease the  number of parameters and floating point operations. By doing that, we achieve more  than twofold model reduction, while keeping the performance levels almost intact. Our  fastest model undergoes a significant speed-up boost from 20 FPS to 55 FPS on a generic  GPU card on 512×512 inputs with solid 81.1% mean iou performance on the test set of  PASCAL VOC [18], while our slowest model with 32 FPS (from original 17 FPS) shows  82.7% mean iou on the same dataset. Alternatively, we showcase that our approach is  easily mixable with light-weight classification networks: we attain 79.2% mean iou on  PASCAL VOC using a model that contains only 3.3M parameters and performs only  9.3B floating point operations.

     我们认为有效和高效的语义图像分割是一个重要的任务。特别是,我们采用了一个强大的语义分割架构RefineNet[46],使其更加紧凑,甚至适用于需要高分辨率输入的实时性能的任务。为此,我们在原始设置中确定了计算开销较大的块,并提出了两个修改,目的是减少参数和浮点运算的数量。通过这样做,我们实现了两倍以上的模型缩减,同时几乎保持了性能水平不变。最快模型经历了从一个巨大的加速提升20 FPS 55 FPS通用GPU卡上512×512输入81.1%意味着借据性能测试集的PASCAL VOC[18],而我们最慢的模型与32 FPS(从原始17 FPS)显示,82.7%意味着在相同的数据集。或者,我们展示了我们的方法很容易与轻量级分类网络混合:我们使用一个仅包含3.3M的参数且仅执行93亿次浮点运算的模型,在PASCAL VOC上获得79.2%的平均iou。


论文

Vladimir Nekrasov, Chunhua Shen, Ian Reid

Light-Weight RefineNetfor Real-Time Semantic Segmentation. BMVC 2018

http://bmvc2018.org/contents/papers/0494.pdf



0.1、实验结果


1、Experiments


Six popular datasets for semantic segmentation on indoors and outdoors scenes (NYUDv2, PASCAL VOC 2012, SUN-RGBD, PASCAL-Context, Cityscapes, ADE20K MIT)

6个流行的用于室内外场景语义分割的数据集(NYUDv2, PASCAL VOC 2012, SUN-RGBD, PASCAL- context, Cityscapes, ADE20K MIT)

One dataset for object parsing called Person-Part

一个用于对象解析的数据集,称为Person-Part

2、Object parsing results on the Person-Part dataset

image.png




3、Prediction examples on Person-Parts dataset

image.png



4、Pascal VOC 2012测试集的结果(IOU分数)—RefineNet 记录了最佳性能(IOU 83.4)


Table 5. Results on the PASCAL VOC 2012 test set (IoU scores). Our RefineNet archives the best performance (IoU 83.4).

image.png



5、Our prediction examples on VOC 2012 dataset


image.png


6、城市景观数据集的预测实例


Prediction examples on Cityscapes dataset


image.png



0.2、Light-Weight RefineNet的实验性能


1、Quantitative results on PASCAL VOC


        55 FPS on a generic GPU card on 512╳512 inputs with solid 81.1%mIoUwhile our slowest model with 32 FPS shows 82.7% mIoU.    55 FPS通用GPU卡上512╳512与固体81.1% miouwhile慢模型输入32 FPS mIoU显示82.7%。


image.png






1、回顾先前网络的缺点


ResNet:特征图分辨率逐步降低

Dilated convolutions 膨胀卷积:

计算量大、高内存占用(需存储中间特征图)、粗糙下采样

image.png


RefineNet算法的架构详解


DL之RefineNet:RefineNet算法的架构详解https://yunyaniu.blog.csdn.net/article/details/100056395





RefineNet算法的案例应用


更新……




相关实践学习
基于阿里云DeepGPU实例,用AI画唯美国风少女
本实验基于阿里云DeepGPU实例,使用aiacctorch加速stable-diffusion-webui,用AI画唯美国风少女,可提升性能至高至原性能的2.6倍。
相关文章
|
2天前
|
机器人 Unix C++
ROS机器人编程技术架构命令应用
ROS机器人编程技术架构命令应用
6 1
|
2天前
|
Cloud Native 安全 持续交付
构建未来:云原生架构在现代企业中的应用与挑战
【5月更文挑战第12天】 随着数字化转型的浪潮不断冲击传统IT架构,企业亟需灵活、高效且可扩展的技术解决方案以保持竞争力。云原生技术作为一种新兴的系统构建方式,以其独特的弹性、微服务和持续交付等特性,成为推动企业快速响应市场变化的关键因素。本文将深入探讨云原生架构的核心组件,分析其如何促进企业的敏捷性,以及在实施过程中可能遇到的挑战和解决策略,为企业采纳云原生技术提供参考。
|
2天前
|
Cloud Native Devops 持续交付
构建未来:云原生架构在现代企业中的应用与挑战
【5月更文挑战第11天】 随着数字化转型的深入,企业对技术的敏捷性、可扩展性和成本效益提出了更高的要求。云原生架构作为一种新兴的设计理念和实践方法,正逐渐成为推动企业技术革新的关键力量。本文将深入探讨云原生架构的核心组件,包括容器化、微服务、持续集成/持续交付(CI/CD)以及DevOps文化,并分析它们如何共同作用于企业的IT基础设施,实现灵活、高效的运营模式。同时,我们也将识别在采纳云原生技术时面临的主要挑战,并提出相应的解决策略,以帮助企业顺利过渡到云原生时代。
|
2天前
|
机器学习/深度学习 人工智能 算法
【图像版权】论文阅读:CRMW 图像隐写术+压缩算法
【图像版权】论文阅读:CRMW 图像隐写术+压缩算法
10 0
|
2天前
|
弹性计算 负载均衡 容灾
应用阿里云弹性计算:打造高可用性云服务器ECS架构
阿里云弹性计算助力构建高可用云服务器ECS架构,通过实例分布、负载均衡、弹性IP、数据备份及多可用区部署,确保业务连续稳定。自动容错和迁移功能进一步增强容灾能力,提供全方位高可用保障。
69 0
|
2天前
|
运维 Cloud Native 持续交付
构建未来:云原生架构在现代企业中的应用与挑战
【5月更文挑战第9天】 随着数字化转型的浪潮席卷全球,企业正迅速采纳云原生技术以实现敏捷性、可扩展性和弹性。本文深入探讨了云原生架构的关键组件,包括容器化、微服务、持续集成/持续部署(CI/CD)和DevOps文化,并分析了这些技术如何帮助企业加速产品上市时间,提高运营效率,并最终实现业务目标。同时,文章也识别了企业在采纳云原生实践中可能面临的挑战,如安全性考量、团队技能提升和复杂的网络管理,并提出了相应的解决方案和最佳实践。
|
2天前
|
SpringCloudAlibaba Dubbo 应用服务中间件
【微服务】微服务初步认识 - 微服务技术如何学习 · 认识微服务架构
【微服务】微服务初步认识 - 微服务技术如何学习 · 认识微服务架构
12 0
|
18小时前
|
敏捷开发 Kubernetes API
构建高效微服务架构:后端开发的新趋势
【5月更文挑战第17天】 随着现代应用需求的多样化和复杂化,传统的单体应用架构逐渐显得笨重且难以适应快速变化。微服务架构应运而生,它通过将大型应用拆分为一系列小型、自治的服务来提供灵活性和可扩展性。本文将深入探讨微服务的概念,解析其核心组件,并展示如何利用现代后端技术栈构建和维护一个高效的微服务系统。我们将讨论微服务的优势,包括敏捷开发、独立部署、技术多样性以及弹性设计,并分析在实施过程中可能遇到的挑战,如服务发现、数据一致性和网络延迟问题。最后,我们将提供一个实际案例研究,以说明如何在现实世界中应用这些原则。
|
19小时前
|
Java API 开发者
构建高效的微服务架构:后端开发者的实用指南
【5月更文挑战第17天】 随着现代软件开发的复杂性日益增加,传统的单体应用已难以满足快速迭代与灵活部署的需求。微服务架构作为解决这一问题的有效方案,已成为众多企业转型的首选架构模式。本文将深入探讨如何构建一个高效且可维护的微服务系统,涵盖关键设计原则、技术栈选择以及实践中的最佳实践。通过阅读本文,后端开发者将获得构建和优化微服务架构的核心知识,以支持业务的快速成长与创新。
|
1天前
|
设计模式 监控 安全
探索微服务架构下的服务网格
【5月更文挑战第16天】 随着现代软件系统向着复杂、动态和分布式的方向发展,传统的单体应用逐渐演变为更加灵活的微服务架构。在这一转变过程中,服务网格(Service Mesh)作为一种创新的基础设施层,正逐渐成为组织实现微服务治理的新宠。本文将探讨服务网格的基本概念、它在微服务架构中的作用以及它如何简化分布式系统的复杂性。通过对服务网格深入剖析,我们将了解其在提高系统可观测性、安全性及容错能力方面的独特价值,并探讨其对企业技术战略的影响。