DL之ResNet:ResNet算法的简介(论文介绍)、架构详解、案例应用等配图集合之详细攻略

简介: DL之ResNet:ResNet算法的简介(论文介绍)、架构详解、案例应用等配图集合之详细攻略

ResNet算法的简介


      来自微软研究院何恺明等 ,荣获ILSVRC2015的分类任务第一名、CVPR 2016 best paper 。ResNet使得训练深度达数百甚至数千层的网络成为可能,而且性能仍然优异,是深度学习算法中,一个里程碑式的网络。


Abstract  

   Deeper neural networks are more difficult to train. We  present a residual learning framework to ease the training  of networks that are substantially deeper than those used  previously. We explicitly reformulate the layers as learning  residual functions with reference to the layer inputs, instead  of learning unreferenced functions. We provide comprehensive  empirical evidence showing that these residual  networks are easier to optimize, and can gain accuracy from  considerably increased depth. On the ImageNet dataset we  evaluate residual nets with a depth of up to 152 layers—8×  deeper than VGG nets [41] but still having lower complexity.  An ensemble of these residual nets achieves 3.57% error  on the ImageNet test set. This result won the 1st place on the  ILSVRC 2015 classification task. We also present analysis  on CIFAR-10 with 100 and 1000 layers.  

   The depth of representations is of central importance  for many visual recognition tasks. Solely due to our extremely  deep representations, we obtain a 28% relative improvement  on the COCO object detection dataset. Deep  residual nets are foundations of our submissions to ILSVRC  & COCO 2015 competitions1  , where we also won the 1st  places on the tasks of ImageNet detection, ImageNet localization,  COCO detection, and COCO segmentation.

摘要

   更深层次的神经网络更难训练。我们提出了一个残差学习框架来简化网络的训练,这些网络比以前使用的网络要深入得多。我们显式地将层重新表示为参考层输入的学习剩余函数,而不是学习未引用的函数。我们提供了全面的经验证据表明,这些剩余网络更容易优化,并可以从大幅增加的深度获得精度。在ImageNet数据集上,我们评估了高达152层的residual网络—比VGG网络[41]深8倍,但仍然具有较低的复杂性。这些残差网的集合在ImageNet测试集上的误差达到3.57%,该结果在ILSVRC 2015年分类任务中获得第一名。我们还对CIFAR-10进行了100层和1000层的分析。

   在许多视觉识别任务中,表征的深度是至关重要的。仅仅由于我们的深度表示,我们获得了28%的相对改进的COCO对象检测数据集。深度残差网是我们参加ILSVRC & COCO 2015竞赛的基础,并在ImageNet检测、ImageNet定位、COCO检测、COCO分割等方面获得第一名。



1、比赛结果-ResNets @ ILSVRC & COCO 2015 Competitions


1st places in all five main tracks  五大tracks的第一名,并且大都远远超出第二名!


ImageNet Classification: “Ultra-deep” 152-layer nets  

ImageNet分类问题:“超深”152层网

ImageNet Detection: 16% better than 2nd

ImageNet检测问题:比第二名高16%

ImageNet Localization: 27% better than 2nd

ImageNet定位问题:比第二名好27%

COCO Detection: 11% better than 2nd

COCO检测问题:比第二名好11%

COCO Segmentation: 12% better than 2nd

COCO分割问题:比第二名好12%


2、ResNet的深度革命


  ResNet采用了很深的152层的网络,准确度脱颖而出,甚至比人的识别率还要高,比排行第二的GoogleNet网络准确度超出很多!

image.png







论文

Kaiming He, Xiangyu Zhang, Shaoqing Ren, and Jian Sun(2015): Deep Residual Learning for Image Recognition. arXiv:1512.03385 [cs] (December 2015).

Kaiming He, XiangyuZhang, ShaoqingRen, & Jian Sun.

“Deep Residual Learning for Image Recognition”. CVPR 2016(best paper award).

https://arxiv.org/abs/1512.03385




1、残差模块


增加了”短路”连接(shortcut connection)或称为跳跃连接(skip connection)

学习残差映射(residual mapping)而不是直接学习期望映射

瓶颈残差块,网络较深(大于50层)时使用后面这种(bottleneck)来提高效率

2、网络架构


plain network:基于VGG19的架构把网络增加到34层

Residual Network:plain network基础上增加残差模块

深度变化:34、50、101、152

3、实验结果


单个模型:top-5错误率为4.49%

ensemble:top-5错误率为3.57%



ResNet算法的架构详解


DL之ResNet:ResNet算法的架构详解


ResNet:方块对应【3*3】的卷积层,其特征在于引入了横跨层的快捷结构。

image.png

image.png









相关文章
|
6月前
|
存储 监控 JavaScript
基于布隆过滤器的 Node.js 算法在局域网电脑桌面监控设备快速校验中的应用研究
本文探讨了布隆过滤器在局域网电脑桌面监控中的应用,分析其高效空间利用率、快速查询性能及动态扩容优势,并设计了基于MAC地址的校验模型,提供Node.js实现代码,适用于设备准入控制与重复数据过滤场景。
258 0
|
5月前
|
运维 监控 JavaScript
基于 Node.js 图结构的局域网设备拓扑分析算法在局域网内监控软件中的应用研究
本文探讨图结构在局域网监控系统中的应用,通过Node.js实现设备拓扑建模、路径分析与故障定位,提升网络可视化、可追溯性与运维效率,结合模拟实验验证其高效性与准确性。
332 3
|
5月前
|
机器学习/深度学习 资源调度 算法
遗传算法模型深度解析与实战应用
摘要 遗传算法(GA)作为一种受生物进化启发的优化算法,在复杂问题求解中展现出独特优势。本文系统介绍了GA的核心理论、实现细节和应用经验。算法通过模拟自然选择机制,利用选择、交叉、变异三大操作在解空间中进行全局搜索。与梯度下降等传统方法相比,GA不依赖目标函数的连续性或可微性,特别适合处理离散优化、多目标优化等复杂问题。文中详细阐述了染色体编码、适应度函数设计、遗传操作实现等关键技术,并提供了Python代码实现示例。实践表明,GA的成功应用关键在于平衡探索与开发,通过精心调参维持种群多样性同时确保收敛效率
|
5月前
|
机器学习/深度学习 边缘计算 人工智能
粒子群算法模型深度解析与实战应用
蒋星熠Jaxonic是一位深耕智能优化算法领域多年的技术探索者,专注于粒子群优化(PSO)算法的研究与应用。他深入剖析了PSO的数学模型、核心公式及实现方法,并通过大量实践验证了其在神经网络优化、工程设计等复杂问题上的卓越性能。本文全面展示了PSO的理论基础、改进策略与前沿发展方向,为读者提供了一份详尽的技术指南。
粒子群算法模型深度解析与实战应用
|
5月前
|
机器学习/深度学习 算法 安全
小场景大市场:猫狗识别算法在宠物智能设备中的应用
将猫狗识别算法应用于宠物智能设备,是AIoT领域的重要垂直场景。本文从核心技术、应用场景、挑战与趋势四个方面,全面解析这一融合算法、硬件与用户体验的系统工程。
|
6月前
|
算法 数据可视化
matlab版本粒子群算法(PSO)在路径规划中的应用
matlab版本粒子群算法(PSO)在路径规划中的应用
|
7月前
|
存储 监控 算法
公司员工泄密防护体系中跳表数据结构及其 Go 语言算法的应用研究
在数字化办公中,企业面临员工泄密风险。本文探讨使用跳表(Skip List)数据结构优化泄密防护系统,提升敏感数据监测效率。跳表以其高效的动态数据处理能力,为企业信息安全管理提供了可靠技术支持。
165 0
|
4月前
|
机器学习/深度学习 算法 机器人
【水下图像增强融合算法】基于融合的水下图像与视频增强研究(Matlab代码实现)
【水下图像增强融合算法】基于融合的水下图像与视频增强研究(Matlab代码实现)
461 0
|
4月前
|
数据采集 分布式计算 并行计算
mRMR算法实现特征选择-MATLAB
mRMR算法实现特征选择-MATLAB
312 2
|
5月前
|
传感器 机器学习/深度学习 编解码
MATLAB|主动噪声和振动控制算法——对较大的次级路径变化具有鲁棒性
MATLAB|主动噪声和振动控制算法——对较大的次级路径变化具有鲁棒性
295 3