DL之DenseNet:DenseNet算法的简介(论文介绍)、架构详解、案例应用等配图集合之详细攻略

简介: DL之DenseNet:DenseNet算法的简介(论文介绍)、架构详解、案例应用等配图集合之详细攻略

DenseNet算法的简介(论文介绍)


       DenseNet算法即Densely Connected Convolutional Networks,在某种度上也借鉴了ResNet算法,相关论文获得2017 (CVPR Best Paper Award)。



Abstract  

     Recent work has shown that convolutional networks can  be substantially deeper, more accurate, and efficient to train  if they contain shorter connections between layers close to  the input and those close to the output. In this paper, we  embrace this observation and introduce the Dense Convolutional  Network (DenseNet), which connects each layer  to every other layer in a feed-forward fashion. Whereas  traditional convolutional networks with L layers have L  connections—one between each layer and its subsequent  layer—our network has L(L+1)  2  direct connections. For  each layer, the feature-maps of all preceding layers are  used as inputs, and its own feature-maps are used as inputs  into all subsequent layers. DenseNets have several compelling  advantages: they alleviate the vanishing-gradient  problem, strengthen feature propagation, encourage feature  reuse, and substantially reduce the number of parameters.  We evaluate our proposed architecture on four highly  competitive object recognition benchmark tasks (CIFAR-10,  CIFAR-100, SVHN, and ImageNet). DenseNets obtain significant  improvements over the state-of-the-art on most of  them, whilst requiring less computation to achieve high performance.  Code and pre-trained models are available at  https://github.com/liuzhuang13/DenseNet.


摘要

     最近的研究表明,如果卷积网络在靠近输入和接近输出的层之间包含较短的连接,那么卷积网络可以更深入、更准确和有效地训练。在本文中,我们采用这种观测方法,并引入了紧密卷积网络(densenet),它以一种前馈的方式将每一层连接到另一层。传统的具有L层的卷积网络在每一层和其后续层之间都有L连接,而我们的网络有L(L+1)2个直接连接。对于每个图层,前面所有图层的 feature-maps都用作输入,其自身的 feature-maps也用作后面所有图层的输入。 DenseNets有几个引人注目的优点:它们可以缓解消失梯度问题,加强特征传播,鼓励特征重用,并大幅减少参数数量。我们在四个高度竞争的对象识别基准任务 (CIFAR-10,  CIFAR-100, SVHN, and ImageNet)上评估我们提出的体系结构。DenseNets 在大多数方面都比最先进的技术有了显著的改进,同时需要较少的计算来实现高性能。可在https://github.com/liuzhuang13/DenseNet上获取代码和预训练模型。


Conclusion  

     We proposed a new convolutional network architecture,  which we refer to as Dense Convolutional Network  (DenseNet). It introduces direct connections between any  two layers with the same feature-map size. We showed that  DenseNets scale naturally to hundreds of layers, while exhibiting  no optimization difficulties. In our experiments,DenseNets tend to yield consistent improvement in accuracy  with growing number of parameters, without any signs  of performance degradation or overfitting. Under multiple  settings, it achieved state-of-the-art results across several  highly competitive datasets. Moreover, DenseNets  require substantially fewer parameters and less computation  to achieve state-of-the-art performances. Because we  adopted hyperparameter settings optimized for residual networks  in our study, we believe that further gains in accuracy  of DenseNets may be obtained by more detailed tuning of  hyperparameters and learning rate schedules.

      Whilst following a simple connectivity rule, DenseNets  naturally integrate the properties of identity mappings, deep  supervision, and diversified depth. They allow feature reuse  throughout the networks and can consequently learn more  compact and, according to our experiments, more accurate  models. Because of their compact internal representations  and reduced feature redundancy, DenseNets may be good  feature extractors for various computer vision tasks that  build on convolutional features, e.g., [4, 5]. We plan to  study such feature transfer with DenseNets in future work.

结论

      我们提出了一种新的卷积网络结构,我们称之为密集卷积网络(DenseNet)。它引入了任何两层之间具有相同feature-map大小的直接连接。我们发现 DenseNets可以自然地扩展到数百层,但不存在优化困难。在我们的实验中,随着参数数量的增加, DenseNets的精确度会持续提高,而不会出现性能下降或过度拟合的迹象。在多个设置下,它在多个高度竞争的数据集中实现了最先进的结果。此外, DenseNets需要更少的参数和更少的计算来实现最先进的性能。因为我们在研究中采用了针对剩余网络进行优化的超参数设置,我们相信通过更详细地调整超参数和学习速率时间表,可以进一步提高 DenseNets的精度。

      在遵循简单连接规则的同时, DenseNets自然地整合了身份映射、深度监督和多样化深度的属性。它们允许在整个网络中重复使用功能,因此可以学习更紧凑的,根据我们的实验,更精确的模型。由于其紧凑的内部表示和减少的特征冗余,DenseNets可能是各种计算机视觉任务的很好的特征提取器,这些任务基于卷积特征,例如[4,5]。我们计划在未来的工作中与DenseNets一起研究这种特征转移。


论文

Gao Huang, Zhuang Liu, Laurens van der Maaten, Kilian Weinberger.

Densely connected convolutional networks. CVPR. 2017 (CVPR Best Paper Award)

https://arxiv.org/pdf/1608.06993.pdf



GitHub

https://github.com/liuzhuang13/DenseNet

      DenseNet is a network architecture where each layer is directly connected to every other layer in a feed-forward fashion (within each dense block). For each layer, the feature maps of all preceding layers are treated as separate inputs whereas its own feature maps are passed on as inputs to all subsequent layers. This connectivity pattern yields state-of-the-art accuracies on CIFAR10/100 (with or without data augmentation) and SVHN. On the large scale ILSVRC 2012 (ImageNet) dataset, DenseNet achieves a similar accuracy as ResNet, but using less than half the amount of parameters and roughly half the number of FLOPs.

      Densenet是一种网络架构,其中每一层以前馈方式(在每个密集块内)直接连接到其他每一层。对于每个图层,前面所有图层的要素图都被视为单独的输入,而它自己的要素图则作为输入传递给后面所有图层。这种连接模式在CIFAR10/100(有或无数据扩充)和SVHN上产生最先进的精度。在大规模的ILSVRC 2012(ImageNet)数据集上,DenseNet 实现了与ResNet相似的精度,但使用的参数数量不到一半,而使用的触发器数量大约为一半。


相关文章
|
12月前
|
缓存 负载均衡 监控
微服务架构下的电商API接口设计:策略、方法与实战案例
本文探讨了微服务架构下的电商API接口设计,旨在打造高效、灵活与可扩展的电商系统。通过服务拆分(如商品、订单、支付等模块)和标准化设计(RESTful或GraphQL风格),确保接口一致性与易用性。同时,采用缓存策略、负载均衡及限流技术优化性能,并借助Prometheus等工具实现监控与日志管理。微服务架构的优势在于支持敏捷开发、高并发处理和独立部署,满足电商业务快速迭代需求。未来,电商API设计将向智能化与安全化方向发展。
580 102
|
Java 网络安全 开发工具
Git进阶笔记系列(01)Git核心架构原理 | 常用命令实战集合
通过本文,读者可以深入了解Git的核心概念和实际操作技巧,提升版本管理能力。
|
运维 NoSQL Java
后端架构演进:微服务架构的优缺点与实战案例分析
【10月更文挑战第28天】本文探讨了微服务架构与单体架构的优缺点,并通过实战案例分析了微服务架构在实际应用中的表现。微服务架构具有高内聚、低耦合、独立部署等优势,但也面临分布式系统的复杂性和较高的运维成本。通过某电商平台的实际案例,展示了微服务架构在提升系统性能和团队协作效率方面的显著效果,同时也指出了其带来的挑战。
748 4
|
存储 算法 安全
ArrayList简介及使用全方位手把手教学(带源码),用ArrayList实现洗牌算法,3个人轮流拿牌(带全部源码)
文章全面介绍了Java中ArrayList的使用方法,包括其构造方法、常见操作、遍历方式、扩容机制,并展示了如何使用ArrayList实现洗牌算法的实例。
267 1
|
算法 Java 数据安全/隐私保护
国密加密算法简介
国密指国家密码局认定的国产密码算法,主要包括SM1、SM2、SM3、SM4等,并持续完善。SM1是对称加密算法,加密强度与AES相当,需加密芯片支持;SM2是非对称加密,基于ECC算法,签名和密钥生成速度优于RSA;SM3为杂凑算法,安全性高于MD5;SM4为对称加密算法,用于无线局域网标准。本文提供使用Java和SpringBoot实现SM2和SM4加密的示例代码及依赖配置。更多国密算法标准可参考国家密码局官网。
4089 1
|
前端开发 大数据 数据库
🔥大数据洪流下的决战:JSF 表格组件如何做到毫秒级响应?揭秘背后的性能魔法!💪
【8月更文挑战第31天】在 Web 应用中,表格组件常用于展示和操作数据,但在大数据量下性能会成瓶颈。本文介绍在 JavaServer Faces(JSF)中优化表格组件的方法,包括数据处理、分页及懒加载等技术。通过后端分页或懒加载按需加载数据,减少不必要的数据加载和优化数据库查询,并利用缓存机制减少数据库访问次数,从而提高表格组件的响应速度和整体性能。掌握这些最佳实践对开发高性能 JSF 应用至关重要。
551 1
|
机器学习/深度学习 人工智能 自然语言处理
算法金 | 秒懂 AI - 深度学习五大模型:RNN、CNN、Transformer、BERT、GPT 简介
**RNN**,1986年提出,用于序列数据,如语言模型和语音识别,但原始模型有梯度消失问题。**LSTM**和**GRU**通过门控解决了此问题。 **CNN**,1989年引入,擅长图像处理,卷积层和池化层提取特征,经典应用包括图像分类和物体检测,如LeNet-5。 **Transformer**,2017年由Google推出,自注意力机制实现并行计算,优化了NLP效率,如机器翻译。 **BERT**,2018年Google的双向预训练模型,通过掩码语言模型改进上下文理解,适用于问答和文本分类。
1266 9
|
算法
Raid5数据恢复—Raid5算法简介&raid5磁盘阵列数据恢复案例
Raid5算法也被称为“异或运算”。异或是一个数学运算符,它应用于逻辑运算。异或的数学符号为“⊕”,计算机符号为“xor”。异或的运算法则为:a⊕b = (¬a ∧ b) ∨ (a ∧¬b)。如果a、b两个值不相同,则异或结果为1。如果a、b两个值相同,异或结果为0。 异或也叫半加运算,其运算法则相当于不带进位的二进制加法。二进制下用1表示真,0表示假。异或的运算法则为:0⊕0=0,1⊕0=1,0⊕1=1,1⊕1=0(同为0,异为1),这些法则与加法是相同的,只是不带进位。 异或略称为XOR、EOR、EX-OR,程序中有三种演算子:XOR、xor、⊕。使用方法如下z = x ⊕ y z
Raid5数据恢复—Raid5算法简介&raid5磁盘阵列数据恢复案例
|
缓存 NoSQL Java
案例 采用Springboot默认的缓存方案Simple在三层架构中完成一个手机验证码生成校验的程序
案例 采用Springboot默认的缓存方案Simple在三层架构中完成一个手机验证码生成校验的程序
384 5
|
缓存 负载均衡 数据管理
深入探索微服务架构的核心要素与实践策略在当今软件开发领域,微服务架构以其独特的优势和灵活性,已成为众多企业和开发者的首选。本文将深入探讨微服务架构的核心要素,包括服务拆分、通信机制、数据管理等,并结合实际案例分析其在不同场景下的应用策略,旨在为读者提供一套全面、深入的微服务架构实践指南。**
**微服务架构作为软件开发领域的热门话题,正引领着一场技术革新。本文从微服务架构的核心要素出发,详细阐述了服务拆分的原则与方法、通信机制的选择与优化、数据管理的策略与挑战等内容。同时,结合具体案例,分析了微服务架构在不同场景下的应用策略,为读者提供了实用的指导和建议。