【深度学习】卷积核的基本概况（上）

2023-05-18 178

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 【深度学习】卷积核的基本概况

前言

在机器学习篇章中，我们简单介绍了卷积核，今天，梳理一下对卷积核一些基本情况。

正文

什么是卷积核

在数学上，卷积核的标准定义是两个函数在反转和移位后的乘积的积分：

其中，函数g一般称为过滤器(filters)，函数f指的是信号/图像。在卷积神经网络里，卷积核其实就是一个过滤器，但在深度学习里，它不做反转，而是直接执行逐元素的乘法和加法，我们把这个又称为互相关，在深度学习里称为卷积。

那为什么在图像处理上，需要进行卷积处理呢。实际上是借鉴于科学家的研究结果——上个世纪科学家就发现，视觉皮层的很多神经元都有一个小的局部感受野，神经元只对有限区域的感受野上的刺激物做出反应。不同的感受野可以重叠，他们共同铺满整个视野。并且发现，一些神经元仅仅对横线有反应，有一些神经元对其他方向的线条有反应，有些神经元的感受野比较大。因此，高级别的神经元的刺激是源于相邻低级别神经元的反应。

利用这个观点，经过不断的努力，逐渐发展成了现在的卷积神经网络。通过卷积核提取图像的局部特征，生成一个个神经元，再经过深层的连接，就构建出了卷积神经网络。

我们已经知道，一个卷积核一般包括核大小(Kernel Size)、步长(Stride)以及填充步数(Padding)，我们逐一解释下。

卷积核大小：卷积核定义了卷积的大小范围，在网络中代表感受野的大小，二维卷积核最常见的就是 3*3 的卷积核。一般情况下，卷积核越大，感受野越大，看到的图片信息越多，所获得的全局特征越好。但大的卷积核会导致计算量的暴增，计算性能也会降低。

步长：卷积核的步长代表提取的精度, 步长定义了当卷积核在图像上面进行卷积操作的时候，每次卷积跨越的长度。对于size为2的卷积核，如果step为1，那么相邻步感受野之间就会有重复区域；如果step为2，那么相邻感受野不会重复，也不会有覆盖不到的地方；如果step为3，那么相邻步感受野之间会有一道大小为1颗像素的缝隙，从某种程度来说，这样就遗漏了原图的信息。

填充：卷积核与图像尺寸不匹配，会造成了卷积后的图片和卷积前的图片尺寸不一致，为了避免这种情况，需要先对原始图片做边界填充处理。