【深度学习】卷积核的基本概况(下)

简介: 【深度学习】卷积核的基本概况(下)

正文


卷积核的种类


除了普通的卷积操作外,也有一些变种,本文我们先介绍概念,对于每一种卷积的作用,我们会再出文章介绍。


  • 转置卷积(反卷积)


一般正常卷积称为下采样,相反方向的转换称为上采样。转置卷积是相对正常卷积的相反操作,但它只恢复尺寸,因为卷积是一个不可逆操作。下面通过一个例子来说明转置卷积的具体操作过程。


假设一个3*3的卷积核,其输入矩阵是4*4的形状,经过步长为1,填充为0的卷积结果为:



17.png

转置卷积过程为,第一步,将卷积核矩阵重新排列为4*16形状:


18.png


第二步,将卷积结果重新排列为1维行向量:


19.png

第三步,将重排矩阵转置后与行向量转置后相乘,得到16个元素的1维列向量:


20.png


第四步,对列向量进行重排为4*4的矩阵,得到最终结果:


21.png


这样就通过转置卷积将2x2的矩阵反卷为一个4x4的矩阵,但从结果也可以看出反卷积的结果与原始输入信号不同。只是保留了位置信息,以及得到了想要的形状。


  • 空洞卷积(扩张卷积)


空洞卷积也叫扩张卷积,指的是在正常的卷积核的点之间插入空洞。它是相对正常的离散卷积而言的,对于步长为2,填充为1的正常卷积如下图:


23.gif

插入空洞后,卷积过程变为:


24.gif


空洞卷积通过空洞率(dilation_rate)控制,上图是空洞率为2的情况。



  • 可分离卷积


可分离卷积分为空间可分离卷积深度可分离卷积

空间可分离卷积有个前提条件,就是卷积核可以表示为两个向量的乘积:


25.png

这样,3x1的kennel首先与图像进行卷积,然后应用1x3的kennel。在执行相同操作时,可以减少参数数量。所以,空间可分离卷积节省了成本,但是一般不使用它做训练,而深度可分离卷积是更常见的形式。


深度可分离卷积包括两个步骤:深度卷积1*1卷积.下面是一个深度可分离卷积的例子:


26.png

对于形状是7*7*3的输入层,有3个通道。

第一步在输入层上应用深度卷积。我们在2D-卷积中分别使用 3 个卷积核(每个filter的大小为3*3*1),每个卷积核仅对输入层的 1 个通道做卷积,这样的卷积每次都得到大小为5*5*1 的映射,之后再将这些映射堆叠在一起创建一个 5*5*3 的特征图:


27.png

第二步进行扩大深度我们用大小为1*1*3的卷积核做1x1卷积。每个卷积核对5*5*3输入图像做卷积后都得到一个大小为5*5*1的特征图,重复做128次1*1卷积,就得到了最终的结果:


28.png



从本质上说,深度可分离卷积就是3D卷积kernels的分解(在深度上的分解),而空间可分离卷积就是2D卷积kernels的分解(在WH上的分解)



  • 分组卷积


分组卷积,顾名思义,filters被拆分为不同的组,每一个组都负责具有一定深度的传统 2D 卷积的工作。


比如下面这张图就展示了分组卷积的原理:


29.png



上图表示的是被拆分为 2 个filters组的分组卷积。在每一组中,其深度仅为传统2D-卷积的一半——Din/2,而每个filters组都包含Dout/2个filters。第一个filters组(红色)对输入层的前半部分做卷积([,0Din/2]),第二个filters组(蓝色)对输入层的后半部分做卷积([:,:,Din/2:Din])。最终,每个filters组都输出了Dout/2个通道。整体上,两个组输出的通道数为Dout ,之后,我们再将这些通道堆叠到输出层.

分组卷积有三个优点:有效的训练;模型参数随着filters组数的增加而减少;可以提供比标准2D卷积更好的模型。


参考资料:

https://www.zhihu.com/question/30888762

https://www.jianshu.com/p/1c9fe3b4dc55

相关文章
|
机器学习/深度学习 计算机视觉
【深度学习】卷积核的基本概况(上)
【深度学习】卷积核的基本概况
|
1天前
|
机器学习/深度学习 算法 计算机视觉
深度学习在图像识别中的应用与挑战
【5月更文挑战第18天】 随着深度学习技术的迅速发展,其在图像识别领域的应用已经取得了显著的成果。本文将探讨深度学习在图像识别中的关键作用,分析其技术实现的基本原理,并讨论当前面临的主要挑战以及未来的发展趋势。我们将重点介绍卷积神经网络(CNN)的结构与优化策略,同时对比不同深度学习模型的性能表现,并提出针对性的改进方法。通过实验结果的分析,本文旨在为图像识别技术的进步提供理论支持和实践指导。
|
1天前
|
机器学习/深度学习 传感器 自动驾驶
基于深度学习的图像识别技术在自动驾驶领域的应用
【5月更文挑战第18天】随着科技的发展,深度学习技术在各个领域的应用越来越广泛。特别是在自动驾驶领域,基于深度学习的图像识别技术已经成为了关键技术之一。本文将详细介绍基于深度学习的图像识别技术在自动驾驶领域的应用,包括其原理、实现方法以及面临的挑战和未来发展趋势。
19 5
|
1天前
|
机器学习/深度学习 人工智能 监控
深度学习在图像识别中的应用与挑战
【5月更文挑战第18天】 随着人工智能技术的飞速发展,深度学习作为其核心推动力之一,在图像识别领域取得了显著的成就。本文将探讨深度学习技术在图像识别任务中的运用,重点分析卷积神经网络(CNN)的结构和优化策略,以及在实际应用中所面临的主要挑战,如模型泛化能力、数据不平衡和对抗性攻击等。通过综合现有文献和最新研究成果,本文旨在为读者提供一个关于深度学习在图像识别领域的应用现状和未来趋势的全面视角。
|
1天前
|
机器学习/深度学习 数据采集 传感器
基于深度学习的图像识别技术在自动驾驶系统中的应用
【5月更文挑战第18天】 随着人工智能技术的飞速发展,特别是深度学习在图像识别领域的突破性进展,自动驾驶技术已经从科幻走向现实。本文旨在探讨如何将基于深度学习的图像识别技术集成到自动驾驶系统中,以提升车辆的环境感知能力、决策效率及安全性。文中不仅回顾了当前自动驾驶中图像识别的关键挑战,还介绍了几种前沿的深度学习模型及其在处理复杂交通场景下的有效性。此外,本文还将讨论数据预处理、增强技术以及模型优化策略对提高自动驾驶系统性能的重要性。
|
1天前
|
机器学习/深度学习 监控 自动驾驶
深度学习在图像识别中的创新应用
【5月更文挑战第18天】 随着人工智能技术的飞速发展,深度学习已成为推动计算机视觉进步的核心动力。尤其在图像识别领域,通过构建和训练复杂的神经网络模型,深度学习技术能够实现对图像内容的高效准确识别。本文将探讨深度学习在图像识别中的最新应用,分析其背后的关键技术,并展望未来的发展趋势。我们将重点讨论卷积神经网络(CNN)的优化策略、数据增强的重要性以及迁移学习的实践案例,旨在为读者提供一个关于如何利用深度学习技术提升图像识别性能的全面视角。
|
1天前
|
机器学习/深度学习 计算机视觉
深度学习在图像识别中的应用进展
【5月更文挑战第18天】 随着计算机视觉技术的飞速发展,深度学习已成为图像识别任务的核心动力。本文综述了深度学习技术在图像识别领域的最新进展,包括卷积神经网络(CNN)的变种结构、迁移学习策略以及增强学习机制。通过分析现有文献和研究成果,本文揭示了深度学习模型在处理复杂图像数据时的优势和挑战,并提出了未来研究的潜在方向。
|
1天前
|
机器学习/深度学习 自然语言处理 算法
深度探索自适应学习率调整策略在深度学习优化中的应用
【5月更文挑战第17天】 在深度学习的复杂网络结构中,学习率扮演着至关重要的角色。一个合适的学习率可以加快收敛速度,避免陷入局部最小值,并提高模型性能。然而,固定的学习率往往难以适应不同阶段的训练需求。因此,自适应学习率调整策略应运而生,其通过动态调整学习率以响应训练过程中的变化,从而提升优化效率。本文将深入分析几种先进的自适应学习率方法,探讨它们的工作原理、优缺点及在实际问题中的应用效果。
|
2天前
|
机器学习/深度学习 算法 数据可视化
深度学习在图像识别中的应用及其挑战
【5月更文挑战第17天】随着科技的发展,深度学习已经在各个领域中得到了广泛的应用,其中图像识别是其最为重要的应用领域之一。本文将探讨深度学习在图像识别中的应用,以及在实际应用中面临的挑战和解决方案。
|
2天前
|
机器学习/深度学习 监控 自动驾驶
深度学习在图像识别中的应用与挑战
【5月更文挑战第17天】 随着人工智能技术的飞速发展,深度学习已成为推动计算机视觉领域革新的核心技术之一。特别是在图像识别任务中,深度神经网络通过模拟人脑对视觉信息的处理机制,显著提高了识别精度和处理速度。本文聚焦于深度学习在图像识别领域的应用现状,探讨了其背后的关键技术,包括卷积神经网络(CNN)的变体、数据增强、迁移学习以及注意力机制等。同时,文章也分析了当前面临的主要挑战,如数据集偏差、模型泛化能力、计算资源需求及对抗性攻击等,并提出了可能的解决方案。