VGG网络

2023-08-03 217

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： VGG网络

三 VGG

VGG 在2014年由牛津大学著名研究组 VGG（Visual Geometry Group）提出，斩获该年 ImageNet 竞赛中 Localization Task（定位任务）第一名和 Classification Task（分类任务）第二名。

原论文地址：Very Deep Convolutional Networks for Large-Scale Image Recognition

VGG网络的创新点：通过堆叠多个小卷积核来替代大尺度卷积核，可以减少训练参数，同时能保证相同的感受野。

论文中提到，可以通过堆叠两个3×3的卷积核替代5x5的卷积核，堆叠三个3×3的卷积核替代7x7的卷积核。

1. CNN感受野

在卷积神经网络中，决定某一层输出结果中一个元素所对应的输入层的区域大小，被称作感受野（receptive field）。

通俗的解释是，输出feature map上的一个单元对应输入层上的区域大小。

以下图为例，输出层 layer3 中一个单元对应输入层 layer2 上区域大小为2×2（池化操作），对应输入层 layer1 上大小为5×5

（可以这么理解，layer2中 2×2区域中的每一块对应一个3×3的卷积核，又因为 stride=2，所以layer1的感受野为5×5）

感受野的计算公式为：

F ( i ) = ( F ( i + 1 ) − 1 ) × Stride + Ksize

F ( i ) F(i)F(i) 为第 i ii 层感受野

S t r i d e StrideStrid**e 为第 i ii 层的步距

K s i z e KsizeKsize 为卷积核或池化核尺寸

以上图为例：

Feature map: F ( 3 ) = 1

Pool1：F ( 2 ) = ( 1 − 1 ) × 2 + 2 = 2

Conv1: F ( 1 ) = ( 2 − 1 ) × 2 + 3 = 5

2. 小卷积核

现在，我们来验证下VGG论文中的两点结论：

1.堆叠两个3×3的卷积核替代5x5的卷积核，堆叠三个3×3的卷积核替代7x7的卷积核。替代前后感受野是否相同？

（注：VGG网络中卷积的Stride默认为1）

Feature map: F = 1

Conv3x3(3): F = ( 1 − 1 ) × 1 + 3 = 3

Conv3x3(2): F = ( 3 − 1 ) × 1 + 3 = 5 （5×5卷积核感受野）

Conv3x3(1): F = ( 5 − 1 ) × 1 + 3 = 7 （7×7卷积核感受野）

2.堆叠3×3卷积核后训练参数是否真的减少了？

注：CNN参数个数 = 卷积核尺寸×卷积核深度 × 卷积核组数 = 卷积核尺寸 × 输入特征矩阵深度 × 输出特征矩阵深度

现假设输入特征矩阵深度 = 输出特征矩阵深度 = C

使用7×7卷积核所需参数个数：
堆叠三个3×3的卷积核所需参数个数：

3. VGG-16

VGG网络有多个版本，一般常用的是VGG-16模型，其网络结构如下如所示：

稍作计算可以发现，经3×3卷积的特征矩阵的尺寸是不改变的：

VGG网络

三 VGG

1. CNN感受野

2. 小卷积核

3. VGG-16

热门文章

最新文章

相关课程

相关电子书

相关实验场景

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

VGG网络

三 VGG

1. CNN感受野

2. 小卷积核

3. VGG-16

热门文章

最新文章

相关课程

相关电子书

相关实验场景