RoR(ResNet of ResNet) - 用于图像分类的多级残差网络

简介: 今天,我们来简短地回顾一下RoR(残余网络的残余网络)。
TB1LPPhNmrqK1RjSZK9XXXyypXa.jpg

本文为 AI 研习社编译的技术博客,原标题 :

Review: RoR — ResNet of ResNet / Multilevel ResNet (Image Classification)

作者 | Sik-Ho Tsang

翻译 | 斯蒂芬·二狗子         

校对 | 酱番梨        审核 | 约翰逊·李加薪       整理 | 立鱼王

原文链接:

https://towardsdatascience.com/review-ror-resnet-of-resnet-multilevel-resnet-image-classification-cd3b0fcc19bb

在本文中,我们简短地回顾一下RoR(残余网络的残余网络)。在成为最先进的深度学习方法并赢得众多竞赛认可的ResNet成功之后,有许多研究者对如何推广或改进ResNet的做出了研究,相关的有 Pre-Activation ResNet, ResNet in ResNet (RiR), ResNet with Stochastic Depth (SD), Wide Residual Network (WRN)。RoR就是一篇改进ResNet的论文,它们引入了一组概念,就是带有短连接的ResNet模块。这个创新使得网络成为多级分层的ResNet模型。这篇论文于2016年首次出现在ResNet之后,于2017年被接受并最终于2018年TCSVT发表,已经有数十篇引文。

本文包括的内容:

RoR的概念(Res网络模块的残差网络)

RoR-m:等级数m

RoR的不同版本

结论

   1.RoR概念(残差网络的残差网络)

TB1nmAVN5LaK1RjSZFxXXamPFXa.jpg

原始ResNet(左),RoR(右)

Original ResNet 显示在左上方,许多Res块级联在一起并形成一个非常深的网络。

在 Res块 中,有两条路径:

卷积路径,执行卷积以提取特征。

短连接方式将输入信号直接传输到下一层的连接路径。

利用短连接路径,可以减少梯度消失问题,因为在反向传播期间误差信号可以更容易地传播到前面的层。

上面右侧显示的RoR的建议,我们也可以在多个Res块上进行短连接。除此之外,我们还可以在一组“剩余块组”中建立另一级别的短连接。

 作者认为:

RoR将学习问题转变为学习残差到残差映射,这比原始 ResNet  更简单,更容易学习。

并且上面的块中的层也可以将信息传播到下面块中的层。

   2.RoR-:Level Number m

级别编号m介绍:

当m = 1时,RoR仅具有最终级短连接,即原始残差网络。

当m = 2时,RoR只有root-level(最外层)和最终级别的短连接。

当m = 3时,RoR具有根级别,中级和最终级别的连接。

对于中级连接,每个短连接将跨越具有相同数量的特征图的Res块。

对m = 4和5也进行了测试,但在论文中没有任何关于它的细节。结果与m = 3相比不够好。

   3.RoR的不同版本

TB1j.EpN9rqK1RjSZK9XXXyypXa.jpg

RoR-3使用原始ResNet(左),RoR-3使用Pre-ResNet或WRN(右)

如上图所示,RoR适应于不同版本的ResNet。

RoR-3:使用原始ResNet且m = 3的RoR

Pre-RoR-3:使用Pre-Activation ResNet且m = 3的RoR

RoR-3-WRN:使用WRN且m = 3的RoR

简而言之,RoR-3使用Conv-BN-ReLU。 Pre-RoR-3使用BN-ReLU-Conv,而WRN是更宽更浅的Pre-RoR-3。 (如果有兴趣,请阅读我对原始ResNet,Pre-Activation ResNet和WRN的评论,见原文。)

   4.结果

4.1三个数据集CIFAR-10, CIFAR-100, SVHN

CIFAR-10: 10类分类数据

CIFAR-100: 100类分类数据

SVHN: 街景房屋号数据集

TB1G.oEN3HqK1RjSZJnXXbNLpXa.jpg

CIFAR-10,CIFAR-100,SVHN数据集上的测试的错误率(%)

RoR-3-164:通过将RoR应用于164层原始ResNet,

(+ SD 表示使用随机深度,以减少过度拟合),分别获得CIFAR-10和CIFAR-100数据集的4.86%和 22.47%测试错误率。

(164是模型深度。)

Pre-RoR-3-164 + SD:通过用Pre-ResNet替换原始残差模块的RoR模型,分别获得CIFAR-10和CIFAR-100数据集的4.51%和21.94%测试错误率。

RoR-3-WRN40-4 + SD:通过用更宽的40层WRN40-4替换pre-ResNet,分别获得CIFAR-10和CIFAR-100数据集的4.09%和20.11%测试错误率。

RoR-3-WRN58-4 + SD:对于更深层的58层WRN-58-4,分别获得了CIFAR-10和CIFAR-100数据集的3.77%和19.73%的测试错误率。

4.2 ImageNet数据集

ImageNet:ILSVRC中的1000类的大规模数据集。

TB1fh7uNYPpK1RjSZFFXXa5PpXa.jpg TB18RE0N4jaK1RjSZKzXXXVwXXa.png

ImageNet数据集上的10个目标的Top1和Top5测试错误率(%)

RoR-3的不同层版本始终优于ResNet的不同层版本。本文中有详细的验证实验。如有兴趣,请访问论文。

使用长跳过连接和短跳过连接的类似方法也已应用于生物医学图像分割。希望我也可以下一次谈这个。

相关参考

[2018 TCSVT] [RoR]

Residual Networks of Residual Networks: Multilevel Residual Networks

我对图像分类的相关评论博文

[LeNet] [AlexNet] [ZFNet] [VGGNet] [SPPNet] [PReLU-Net] [GoogLeNet / Inception-v1] [BN-Inception / Inception-v2] [Inception-v3] [Inception-v4] [Xception] [MobileNetV1] [ResNet] [Pre-Activation ResNet] [RiR] [Stochastic Depth] [WRN] [DenseNet]

感谢 Ludovic Benistant.

想要继续查看该篇文章相关链接和参考文献?雷锋网雷锋网雷锋网(公众号:雷锋网)

点击【RoR(ResNet of ResNet) - 用于图像分类的多级残差网络】或长按下方地址访问:

https://ai.yanxishe.com/page/TextTranslation/1526

Python中文书籍大集合

100本Python中文电子书,6份源代码,Python从入门到出家,一条龙服务。

包含Python基础、进阶、爬虫、算法实现、深度学习、TensorFlow、NLP等等

友情提示:文件大小为2.89GB,慎用流量下载,可以先收藏哟~~!

点击链接即可获取:https://ai.yanxishe.com/page/resourceDetail/676

目录
相关文章
|
6月前
|
机器学习/深度学习 PyTorch 算法框架/工具
【从零开始学习深度学习】31. 卷积神经网络之残差网络(ResNet)介绍及其Pytorch实现
【从零开始学习深度学习】31. 卷积神经网络之残差网络(ResNet)介绍及其Pytorch实现
|
3月前
|
机器学习/深度学习 人工智能 算法
鸟类识别系统Python+卷积神经网络算法+深度学习+人工智能+TensorFlow+ResNet50算法模型+图像识别
鸟类识别系统。本系统采用Python作为主要开发语言,通过使用加利福利亚大学开源的200种鸟类图像作为数据集。使用TensorFlow搭建ResNet50卷积神经网络算法模型,然后进行模型的迭代训练,得到一个识别精度较高的模型,然后在保存为本地的H5格式文件。在使用Django开发Web网页端操作界面,实现用户上传一张鸟类图像,识别其名称。
110 12
鸟类识别系统Python+卷积神经网络算法+深度学习+人工智能+TensorFlow+ResNet50算法模型+图像识别
|
2月前
|
机器学习/深度学习 API 算法框架/工具
残差网络(ResNet) -深度学习(Residual Networks (ResNet) – Deep Learning)
残差网络(ResNet) -深度学习(Residual Networks (ResNet) – Deep Learning)
39 0
|
2月前
|
机器学习/深度学习 编解码 自然语言处理
ResNet(残差网络)
【10月更文挑战第1天】
|
6月前
|
机器学习/深度学习 人工智能 算法
【昆虫识别系统】图像识别Python+卷积神经网络算法+人工智能+深度学习+机器学习+TensorFlow+ResNet50
昆虫识别系统,使用Python作为主要开发语言。通过TensorFlow搭建ResNet50卷积神经网络算法(CNN)模型。通过对10种常见的昆虫图片数据集('蜜蜂', '甲虫', '蝴蝶', '蝉', '蜻蜓', '蚱蜢', '蛾', '蝎子', '蜗牛', '蜘蛛')进行训练,得到一个识别精度较高的H5格式模型文件,然后使用Django搭建Web网页端可视化操作界面,实现用户上传一张昆虫图片识别其名称。
329 7
【昆虫识别系统】图像识别Python+卷积神经网络算法+人工智能+深度学习+机器学习+TensorFlow+ResNet50
|
5月前
|
计算机视觉 网络架构
【YOLOv8改进 - 卷积Conv】DWRSeg:扩张式残差分割网络,提高特征提取效率和多尺度信息获取能力,助力小目标检测
YOLO目标检测专栏探讨了YOLO的创新改进,如多尺度特征提取的DWRSeg网络。该网络通过区域残差化和语义残差化提升效率,使用DWR和SIR模块优化高层和低层特征。DWRSeg在Cityscapes和CamVid数据集上表现优秀,速度与准确性兼备。论文和代码已公开。核心代码展示了一个包含DWR模块的卷积层。更多配置详情见相关链接。
|
4月前
|
机器学习/深度学习 监控 数据可视化
|
7月前
|
机器学习/深度学习 算法
基于深度学习网络的十二生肖图像分类matlab仿真
该内容是关于使用GoogLeNet算法进行十二生肖图像分类的总结。在MATLAB2022a环境下,GoogLeNet通过Inception模块学习高层语义特征,处理不同尺寸的输入。核心程序展示了验证集上部分图像的预测标签和置信度,以4x4网格显示16张图像,每张附带预测类别和概率。
|
7月前
|
机器学习/深度学习 数据可视化 数据挖掘
【视频】少样本图像分类?迁移学习、自监督学习理论和R语言CNN深度学习卷积神经网络实例
【视频】少样本图像分类?迁移学习、自监督学习理论和R语言CNN深度学习卷积神经网络实例
|
7月前
|
机器学习/深度学习 PyTorch 测试技术
下一篇
无影云桌面