局部感知:CNN通过在底层的局部扫描获得图像的局部特征,然后在高层综合这些特征获取图像的全局信息。这种局部感知的方式可以降低参数的数目。
权值共享:在CNN中,每个卷积核里面的参数即权值,原始图片卷积后会得到一副新的图片,而新图中的每个像素都来自同一个卷积核,这就是权值共享。权值共享进一步降低了参数数目。
多卷积核:一个卷积核只能学习到图像的某一种特征,而设置多个卷积核时,则可以学到多种特征。每个卷积核也是通过学习得到的,那么会不会多个卷积核学到的特征相同呢! 这就涉及到权值初始化的问题了!
降维:卷积层中设置stride本身就有降维的效果,但大多是通过池化层中的max-pooling方法进行特征压缩,提取主要特征。
多层次结构:将低层次的局部特征组合成为较高层次的特征。 不同层级的特征可以对应不同任务。
激活函数层:增加非线性因素,提高模型表达能力。
数据增强:利用数据增强方法可以扩增数据集规模,同时减少过拟合。