DL之NIN:Network in Network算法的简介(论文介绍)、架构详解、案例应用等配图集合之详细攻略

简介: DL之NIN:Network in Network算法的简介(论文介绍)、架构详解、案例应用等配图集合之详细攻略

Network in Network算法的简介(论文介绍)




Abstract

       We propose a novel deep network structure called "Network In Network" (NIN) to enhance model discriminability for local patches within the receptive field. The conventional convolutional layer uses linear filters followed by a nonlinear activation function to scan the input. Instead, we build micro neural networks with more complex structures to abstract the data within the receptive field. We instantiate the micro neural network with a multilayer perceptron, which is a potent function approximator. The feature maps are obtained by sliding the micro networks over the input in a similar manner as CNN; they are then fed into the next layer. Deep NIN can be implemented by stacking mutiple of the above described structure. With enhanced local modeling via the micro network, we are able to utilize global average pooling over feature maps in the classification layer, which is easier to interpret and less prone to overfitting than traditional fully connected layers. We demonstrated the state-of-the-art classification performances with NIN on CIFAR-10 and CIFAR-100, and reasonable performances on SVHN and MNIST datasets.

摘要

      我们提出了一种新的深层网络结构,称为“网络中的网络”(NIN),以增强接受域内局部补丁的模型识别能力。传统的卷积层使用线性滤波器和非线性激活函数扫描输入。相反,我们建立了具有更复杂结构的微神经网络来提取接收域内的数据。我们用一个多层感知器来例示微神经网络,这是一个有效的函数逼近器。这些特征图是通过将微型网络滑动到输入端,以类似于CNN的方式获得的;然后将它们输入到下一层。深度NIN可以通过叠加上述结构的多个来实现。通过微网络增强的局部建模,我们能够利用分类层中特征图的全局平均池,这比传统的完全连接层更容易解释,更不容易过度拟合。我们在cifar-10和cifar-100上演示了NIN的最新分类性能,在svhn和mnist数据集上演示了合理的性能。

Conclusions  

      We proposed a novel deep network called “Network In Network” (NIN) for classification tasks. This  new structure consists of mlpconv layers which use multilayer perceptrons to convolve the input  and a global average pooling layer as a replacement for the fully connected layers in conventional  CNN. Mlpconv layers model the local patches better, and global average pooling acts as a structural  regularizer that prevents overfitting globally. With these two components of NIN we demonstrated  state-of-the-art performance on CIFAR-10, CIFAR-100 and SVHN datasets. Through visualization  of the feature maps, we demonstrated that feature maps from the last mlpconv layer of NIN were  confidence maps of the categories, and this motivates the possibility of performing object detection  via NIN.

结论

      我们提出了一种新的深度网络,称为“网络中的网络”(NIN),用于分类任务。这种新结构由多层感知器卷积输入的mlpconv层和一个全局平均池层组成,以取代传统CNN中的全连接层。Mlpconv层更好地模拟局部小块,而全局平均池充当结构调整器,防止全局过度拟合。通过NIN的这两个组成部分,我们在CIFAR-10、CIFAR-100和SVHN数据集上展示了最先进的性能。通过对特征图的可视化,我们证明了NIN最后一个mlpconv 层的特征图是类别的置信图,这激发了通过NIN进行目标检测的可能性。



Min Lin, QiangChen and ShuichengYan. Network in Network. ICLR, 2014   新加坡国立大学颜水成教授

https://arxiv.org/abs/1312.4400



1、Visualization of NIN


       该论文中,还对最后一个mlpconv层特征图的可视化。仅显示特征图中的前10%激活。与特征图对应的类别是:1 飞机,2 汽车,3 鸟,4 猫,5 鹿,6 狗,7 青蛙,8 马,9 船,10 卡车。对应于输入图像的GT的特征图被突出显示。



image.png



Network in Network算法的架构详解


image.png



1、NIN的引出


                传统卷积操作上的一个想法:把卷积操作用一个神经网络去替换,会有什么样的效果呢?


image.png



2、NIN的特点


image.png


在网络中构建微型网络Mlpconv,它对conv特征进行了组合,提高了卷积的有效性。

对单个像素,1x1卷积等效于该像素点在所有特征上进行一次全连接计算。

Mlpconv中的全连接可以通过1×1 卷积快速实现。





相关文章
|
16天前
|
算法 Java 数据安全/隐私保护
国密加密算法简介
国密指国家密码局认定的国产密码算法,主要包括SM1、SM2、SM3、SM4等,并持续完善。SM1是对称加密算法,加密强度与AES相当,需加密芯片支持;SM2是非对称加密,基于ECC算法,签名和密钥生成速度优于RSA;SM3为杂凑算法,安全性高于MD5;SM4为对称加密算法,用于无线局域网标准。本文提供使用Java和SpringBoot实现SM2和SM4加密的示例代码及依赖配置。更多国密算法标准可参考国家密码局官网。
26 1
|
1天前
|
存储 算法 安全
ArrayList简介及使用全方位手把手教学(带源码),用ArrayList实现洗牌算法,3个人轮流拿牌(带全部源码)
文章全面介绍了Java中ArrayList的使用方法,包括其构造方法、常见操作、遍历方式、扩容机制,并展示了如何使用ArrayList实现洗牌算法的实例。
6 0
|
23天前
|
缓存 负载均衡 数据管理
深入探索微服务架构的核心要素与实践策略在当今软件开发领域,微服务架构以其独特的优势和灵活性,已成为众多企业和开发者的首选。本文将深入探讨微服务架构的核心要素,包括服务拆分、通信机制、数据管理等,并结合实际案例分析其在不同场景下的应用策略,旨在为读者提供一套全面、深入的微服务架构实践指南。**
**微服务架构作为软件开发领域的热门话题,正引领着一场技术革新。本文从微服务架构的核心要素出发,详细阐述了服务拆分的原则与方法、通信机制的选择与优化、数据管理的策略与挑战等内容。同时,结合具体案例,分析了微服务架构在不同场景下的应用策略,为读者提供了实用的指导和建议。
|
2月前
|
前端开发 大数据 数据库
🔥大数据洪流下的决战:JSF 表格组件如何做到毫秒级响应?揭秘背后的性能魔法!💪
【8月更文挑战第31天】在 Web 应用中,表格组件常用于展示和操作数据,但在大数据量下性能会成瓶颈。本文介绍在 JavaServer Faces(JSF)中优化表格组件的方法,包括数据处理、分页及懒加载等技术。通过后端分页或懒加载按需加载数据,减少不必要的数据加载和优化数据库查询,并利用缓存机制减少数据库访问次数,从而提高表格组件的响应速度和整体性能。掌握这些最佳实践对开发高性能 JSF 应用至关重要。
48 0
|
2月前
|
存储 设计模式 运维
Angular遇上Azure Functions:探索无服务器架构下的开发实践——从在线投票系统案例深入分析前端与后端的协同工作
【8月更文挑战第31天】在现代软件开发中,无服务器架构因可扩展性和成本效益而备受青睐。本文通过构建一个在线投票应用,介绍如何结合Angular前端框架与Azure Functions后端服务,快速搭建高效、可扩展的应用系统。Angular提供响应式编程和组件化能力,适合构建动态用户界面;Azure Functions则简化了后端逻辑处理与数据存储。通过具体示例代码,详细展示了从设置Azure Functions到整合Angular前端的全过程,帮助开发者轻松上手无服务器应用开发。
17 0
|
2天前
|
机器学习/深度学习 算法 数据安全/隐私保护
基于GA遗传优化的GroupCNN分组卷积网络时间序列预测算法matlab仿真
该算法结合了遗传算法(GA)与分组卷积神经网络(GroupCNN),利用GA优化GroupCNN的网络结构和超参数,提升时间序列预测精度与效率。遗传算法通过模拟自然选择过程中的选择、交叉和变异操作寻找最优解;分组卷积则有效减少了计算成本和参数数量。本项目使用MATLAB2022A实现,并提供完整代码及视频教程。注意:展示图含水印,完整程序运行无水印。
|
1天前
|
算法 决策智能
基于禁忌搜索算法的VRP问题求解matlab仿真,带GUI界面,可设置参数
该程序基于禁忌搜索算法求解车辆路径问题(VRP),使用MATLAB2022a版本实现,并带有GUI界面。用户可通过界面设置参数并查看结果。禁忌搜索算法通过迭代改进当前解,并利用记忆机制避免陷入局部最优。程序包含初始化、定义邻域结构、设置禁忌列表等步骤,最终输出最优路径和相关数据图表。
|
2天前
|
编解码 算法 数据挖掘
基于MUSIC算法的六阵元圆阵DOA估计matlab仿真
该程序使用MATLAB 2022a版本实现基于MUSIC算法的六阵元圆阵DOA估计仿真。MUSIC算法通过区分信号和噪声子空间,利用协方差矩阵的特征向量估计信号到达方向。程序计算了不同角度下的MUSIC谱,并绘制了三维谱图及对数谱图,展示了高分辨率的DOA估计结果。适用于各种形状的麦克风阵列,尤其在声源定位中表现出色。
|
8天前
|
传感器 算法 C语言
基于无线传感器网络的节点分簇算法matlab仿真
该程序对传感器网络进行分簇,考虑节点能量状态、拓扑位置及孤立节点等因素。相较于LEACH算法,本程序评估网络持续时间、节点死亡趋势及能量消耗。使用MATLAB 2022a版本运行,展示了节点能量管理优化及网络生命周期延长的效果。通过簇头管理和数据融合,实现了能量高效和网络可扩展性。
|
2天前
|
数据采集 算法 5G
基于稀疏CoSaMP算法的大规模MIMO信道估计matlab性能仿真,对比LS,OMP,MOMP,CoSaMP
该研究采用MATLAB 2022a仿真大规模MIMO系统中的信道估计,利用压缩感知技术克服传统方法的高开销问题。在稀疏信号恢复理论基础上,通过CoSaMP等算法实现高效信道估计。核心程序对比了LS、OMP、NOMP及CoSaMP等多种算法的均方误差(MSE),验证其在不同信噪比下的性能。仿真结果显示,稀疏CoSaMP表现优异。
9 2