1概述
卷积神经网络是人工神经网络的一种,已成为当前语音分析和图像识别领域的研究热点。它是受生物学上感受野(Receptive Field)的机制而提出的。比如在视觉神经系统中,一个神经元的感受野是指视网膜上的特定区域,只有这个区域内的刺激才能激活该神经元。
2 卷积层
卷积层的作用是提取局部区域的特征,每个卷积核相当于一个特征提取器(大小一般为奇数)。
提取后,大小会变小,具体与提取器有如下关系:
|提取器大小|图片变化 |原图大小|提取后大小|
|--|--|--|--|
|33 | 2 |14|12|
|55 | 4 |14|10|
|77 | 6 |14|8|
|99 | 8 |14|6|
卷积的过程可以看作两个矩阵之间特殊的乘法,如下图所示:
一个是输入张量,另一个是卷积核,卷积核通常为较小尺寸的矩阵,比如3X3,5X5等,卷积核会从输入张量的左上角开始,从左到右,从上到下进行滑动,输入张量部分矩阵与卷积核进行按元素相乘并相加得到一个值。
根据上图所示,输出张量的各个元素计算过程如下:
如下动图演示整个过程:
https://p3-juejin.byteimg.com/tos-cn-i-k3u1fbpfcp/8b670a6a513049aa8f952499ec5f3f0f~tplv-k3u1fbpfcp-zoom-in-crop-mark:1512:0:0:0.awebp
3 池化层
池化层(子采样),卷积层虽然可以大大减少权值连接,但是每个特征映射的神经元个数并没有显著减少。如果后面接一个分类器,分类器的输入维度依然很高,很容易出现过拟合。为了解决这个问题,卷积神经网络一般会在卷积层之后再加上一个池化层(Pooling)操作,也就是子采样。子采样层可以大大降低特征的维度,避免过拟合。
子采样函数一般取区域内所有神经元的最大值(max-pooling)或平均值(average-pooling)。
子采样的作用还在于可以使得下一层的神经元对一些小的形态改变保持不变性,并拥有更大的感受野。
4 全连接层
5 参考资料
https://juejin.cn/post/7130176282427392007?searchId=20231013103921E971354EBC5167AD5BA9