DL之NIN:Network in Network算法的简介(论文介绍)、架构详解、案例应用等配图集合之详细攻略

简介: DL之NIN:Network in Network算法的简介(论文介绍)、架构详解、案例应用等配图集合之详细攻略

Network in Network算法的简介(论文介绍)




Abstract

       We propose a novel deep network structure called "Network In Network" (NIN) to enhance model discriminability for local patches within the receptive field. The conventional convolutional layer uses linear filters followed by a nonlinear activation function to scan the input. Instead, we build micro neural networks with more complex structures to abstract the data within the receptive field. We instantiate the micro neural network with a multilayer perceptron, which is a potent function approximator. The feature maps are obtained by sliding the micro networks over the input in a similar manner as CNN; they are then fed into the next layer. Deep NIN can be implemented by stacking mutiple of the above described structure. With enhanced local modeling via the micro network, we are able to utilize global average pooling over feature maps in the classification layer, which is easier to interpret and less prone to overfitting than traditional fully connected layers. We demonstrated the state-of-the-art classification performances with NIN on CIFAR-10 and CIFAR-100, and reasonable performances on SVHN and MNIST datasets.

摘要

      我们提出了一种新的深层网络结构,称为“网络中的网络”(NIN),以增强接受域内局部补丁的模型识别能力。传统的卷积层使用线性滤波器和非线性激活函数扫描输入。相反,我们建立了具有更复杂结构的微神经网络来提取接收域内的数据。我们用一个多层感知器来例示微神经网络,这是一个有效的函数逼近器。这些特征图是通过将微型网络滑动到输入端,以类似于CNN的方式获得的;然后将它们输入到下一层。深度NIN可以通过叠加上述结构的多个来实现。通过微网络增强的局部建模,我们能够利用分类层中特征图的全局平均池,这比传统的完全连接层更容易解释,更不容易过度拟合。我们在cifar-10和cifar-100上演示了NIN的最新分类性能,在svhn和mnist数据集上演示了合理的性能。

Conclusions  

      We proposed a novel deep network called “Network In Network” (NIN) for classification tasks. This  new structure consists of mlpconv layers which use multilayer perceptrons to convolve the input  and a global average pooling layer as a replacement for the fully connected layers in conventional  CNN. Mlpconv layers model the local patches better, and global average pooling acts as a structural  regularizer that prevents overfitting globally. With these two components of NIN we demonstrated  state-of-the-art performance on CIFAR-10, CIFAR-100 and SVHN datasets. Through visualization  of the feature maps, we demonstrated that feature maps from the last mlpconv layer of NIN were  confidence maps of the categories, and this motivates the possibility of performing object detection  via NIN.

结论

      我们提出了一种新的深度网络,称为“网络中的网络”(NIN),用于分类任务。这种新结构由多层感知器卷积输入的mlpconv层和一个全局平均池层组成,以取代传统CNN中的全连接层。Mlpconv层更好地模拟局部小块,而全局平均池充当结构调整器,防止全局过度拟合。通过NIN的这两个组成部分,我们在CIFAR-10、CIFAR-100和SVHN数据集上展示了最先进的性能。通过对特征图的可视化,我们证明了NIN最后一个mlpconv 层的特征图是类别的置信图,这激发了通过NIN进行目标检测的可能性。



Min Lin, QiangChen and ShuichengYan. Network in Network. ICLR, 2014   新加坡国立大学颜水成教授

https://arxiv.org/abs/1312.4400



1、Visualization of NIN


       该论文中,还对最后一个mlpconv层特征图的可视化。仅显示特征图中的前10%激活。与特征图对应的类别是:1 飞机,2 汽车,3 鸟,4 猫,5 鹿,6 狗,7 青蛙,8 马,9 船,10 卡车。对应于输入图像的GT的特征图被突出显示。



image.png



Network in Network算法的架构详解


image.png



1、NIN的引出


                传统卷积操作上的一个想法:把卷积操作用一个神经网络去替换,会有什么样的效果呢?


image.png



2、NIN的特点


image.png


在网络中构建微型网络Mlpconv,它对conv特征进行了组合,提高了卷积的有效性。

对单个像素,1x1卷积等效于该像素点在所有特征上进行一次全连接计算。

Mlpconv中的全连接可以通过1×1 卷积快速实现。





相关文章
|
人工智能 编解码 算法
DeepSeek加持的通义灵码2.0 AI程序员实战案例:助力嵌入式开发中的算法生成革新
本文介绍了通义灵码2.0 AI程序员在嵌入式开发中的实战应用。通过安装VS Code插件并登录阿里云账号,用户可切换至DeepSeek V3模型,利用其强大的代码生成能力。实战案例中,AI程序员根据自然语言描述快速生成了C语言的base64编解码算法,包括源代码、头文件、测试代码和CMake编译脚本。即使在编译错误和需求迭代的情况下,AI程序员也能迅速分析问题并修复代码,最终成功实现功能。作者认为,通义灵码2.0显著提升了开发效率,打破了编程语言限制,是AI编程从辅助工具向工程级协同开发转变的重要标志,值得开发者广泛使用。
9573 71
DeepSeek加持的通义灵码2.0 AI程序员实战案例:助力嵌入式开发中的算法生成革新
|
存储 分布式计算 算法
大数据-106 Spark Graph X 计算学习 案例:1图的基本计算、2连通图算法、3寻找相同的用户
大数据-106 Spark Graph X 计算学习 案例:1图的基本计算、2连通图算法、3寻找相同的用户
399 0
|
存储 算法 搜索推荐
这些算法在实际应用中有哪些具体案例呢
【10月更文挑战第19天】这些算法在实际应用中有哪些具体案例呢
459 1
|
算法 数据可视化 新制造
Threejs路径规划_基于A*算法案例完整版
这篇文章详细介绍了如何在Three.js中完整实现基于A*算法的路径规划案例,包括网格构建、路径寻找算法的实现以及路径可视化展示等方面的内容。
682 0
Threejs路径规划_基于A*算法案例完整版
|
存储 算法 安全
ArrayList简介及使用全方位手把手教学(带源码),用ArrayList实现洗牌算法,3个人轮流拿牌(带全部源码)
文章全面介绍了Java中ArrayList的使用方法,包括其构造方法、常见操作、遍历方式、扩容机制,并展示了如何使用ArrayList实现洗牌算法的实例。
254 1
|
存储 算法 机器人
Threejs路径规划_基于A*算法案例V2
这篇文章详细介绍了如何在Three.js中使用A*算法进行高效的路径规划,并通过三维物理电路的实例演示了路径计算和优化的过程。
631 0
|
7月前
|
Cloud Native Serverless API
微服务架构实战指南:从单体应用到云原生的蜕变之路
🌟蒋星熠Jaxonic,代码为舟的星际旅人。深耕微服务架构,擅以DDD拆分服务、构建高可用通信与治理体系。分享从单体到云原生的实战经验,探索技术演进的无限可能。
微服务架构实战指南:从单体应用到云原生的蜕变之路
|
弹性计算 API 持续交付
后端服务架构的微服务化转型
本文旨在探讨后端服务从单体架构向微服务架构转型的过程,分析微服务架构的优势和面临的挑战。文章首先介绍单体架构的局限性,然后详细阐述微服务架构的核心概念及其在现代软件开发中的应用。通过对比两种架构,指出微服务化转型的必要性和实施策略。最后,讨论了微服务架构实施过程中可能遇到的问题及解决方案。
|
Cloud Native Devops 云计算
云计算的未来:云原生架构与微服务的革命####
【10月更文挑战第21天】 随着企业数字化转型的加速,云原生技术正迅速成为IT行业的新宠。本文深入探讨了云原生架构的核心理念、关键技术如容器化和微服务的优势,以及如何通过这些技术实现高效、灵活且可扩展的现代应用开发。我们将揭示云原生如何重塑软件开发流程,提升业务敏捷性,并探索其对企业IT架构的深远影响。 ####
469 3