【学习记录】《DeepLearning.ai》第十课:卷积神经网络(Convolutional Neural Networks)

简介: 2021/9/10

第十课:卷积神经网络(Convolutional Neural Networks)

1.1 计算机视觉(Computer vision)

通常如果处理大图用传统的神经网络需要特别大的输入,因此需要大量内存。对于计算机视觉应用来说,要处理大图片,就需要进行卷积计算。


1.2 边缘检测示例

image

垂直边沿检测器:

上图是一个垂直边沿检测器,注意它的计算过程。卷积过程,$6*6$​​的图形经过一个过滤器(或者叫卷积核)$3*3$变成一个$4*4$​图像。​

为了更清晰看到,用上图距离,对于一个$3*3$的卷积过滤器,垂直边缘是一个$3*3$的区域。而对于$6*6$​像素的中间部分,可以被视为一个垂直边缘。


1.3 更多边缘检测内容(More edge detection)

水平边缘检测:

将上面的矩阵旋转90度得到:

image

当然还有其他滤波器,其中的权重不同:

image

第二个是Sobel filter过滤器,第三个是Scharr filter过滤器。

对于$3*3$过滤器,可以将9个数字都作为参数,下节课讨论。


1.4 Padding

如果输入是$n*n$,卷积核是$f*f$,那么输出是$(n-f+1)*(n-f+1)$。

Same卷积:

要想使得输出与之前的输入维度相同,需要填充P个像素点,则,输出变为$(n+2p-f+1)$,令其等于$n$,得到$p=(f-1)/2$,因此当$f$是奇数时,选择相应的填充尺寸,可以得到输出相同的输出尺寸。

在计算机视觉中,通常$f$是奇数,

image

Padding就是在原始输入上填充,p=1在原始输入上填充一圈,以此类推。

也有Valid卷积,也就是p=0。


1.5 卷积步长

如果定义步长为2,下图表示了计算过程:

image

image

stride是步长,一次移动的步长,则输出就是如上图的维度,两边的符号表示向下取整的意思。


1.6 三维卷积(Convolutions over volumes)

三维卷积过程如下:

image

总结一般性规律如下:

image

如图所示:

其中$n_c$必须相同,后面的$n^{'}_c$表示滤波器的个数,比如图中黄色表示垂直滤波器,输出为$4*4$,深黄色表示水平滤波器,输出为$4*4$​,​则将两个滤波器放一起输出就是$4*4*2$,注意这里没有考虑步长,默认步长为1,要是考虑步长,则关于输出的公式改为前一节的样子。


1.7 单层卷积网络(One layer of a convolutional network)

单层卷积网络的过程如下:

image

下面是一些符号表示,结合上图搞清楚,对于第$l$层有如下符号表示:

image

$f^{[l]}$表示过滤器的尺寸,如上面就是3,$p^{[l]}$表示填充的数量,填充一圈就是1,上面课说过了。$s^{[l]}$表示步长,之前也讲过,$c^{[l]}_c$表示过滤器的数量,上上图表示了有两个过滤器,一水平一个垂直。

对于输入来说,是上一层的输出,如图表示$6*6*3$维度如上(公式太长懒得写。。。),其中H和W表示高和宽。输出表示本层的最终输出维度,如上图就是$4*4*2$,对于本层的$n^{[l]}_W$计算方式和$n^{[l]}_H$前面几节课讲过。每一个过滤器的大小、激活单元、权重、偏差的维度在图中都给出来了。​


1.8 简单卷积神经网络示例(A simple convolution network example)

上图是卷积神经网络的一个示例,最终将图像处理完毕变成了$7*7*40$,展开为1960个特征,得到一个输出向量,进而使用logistic回归单元或者softmax回归单元。

规律:随着通道数的加深,高度和宽度会逐渐减少39-37-17-7,而通道数在不断增加,3-10-20-40

对于一个典型的神经网络通常有三层:

1.卷积层(Conv)

2.池化层(Pool)

3.全连接层(FC)

池化层和全连接层比卷积层更容易设计,后面会讲到。


1.9 池化层(Pooling layers)

除了卷积层,卷积网络也经常使用池化层来缩减模型的大小,提高计算速度,同时提高所提取特征的鲁棒性。

image

池化层有两个超参数,f和s(滤波器大小和步长),池化层没有参数来学习。

池化分为最大池化和平均池化,最大池化用的比较多,如下图所示:

image

看清计算过程,上面的$f=3,s=1$。


1.10 卷积神经网络实例(含有全连接层)

image

对于池化层,如果s=2,f=2,则原输入的高度和宽度都减半。

上面是一个神经网络的例子,layer1中有卷积层和池化层,然后FC3,FC4为全连接层。


1.11 为什么使用卷积

PASS

相关文章
|
15天前
|
机器学习/深度学习 计算机视觉 Python
【YOLOv11改进 - 注意力机制】SimAM:轻量级注意力机制,解锁卷积神经网络新潜力
【YOLOv11改进 - 注意力机制】SimAM:轻量级注意力机制,解锁卷积神经网络新潜力本文提出了一种简单且高效的卷积神经网络(ConvNets)注意力模块——SimAM。与现有模块不同,SimAM通过优化能量函数推断特征图的3D注意力权重,无需添加额外参数。SimAM基于空间抑制理论设计,通过简单的解决方案实现高效计算,提升卷积神经网络的表征能力。代码已在Pytorch-SimAM开源。
【YOLOv11改进 - 注意力机制】SimAM:轻量级注意力机制,解锁卷积神经网络新潜力
|
9天前
|
机器学习/深度学习 人工智能 自然语言处理
深度学习中的卷积神经网络:从理论到实践
【10月更文挑战第35天】在人工智能的浪潮中,深度学习技术以其强大的数据处理能力成为科技界的宠儿。其中,卷积神经网络(CNN)作为深度学习的一个重要分支,在图像识别和视频分析等领域展现出了惊人的潜力。本文将深入浅出地介绍CNN的工作原理,并结合实际代码示例,带领读者从零开始构建一个简单的CNN模型,探索其在图像分类任务中的应用。通过本文,读者不仅能够理解CNN背后的数学原理,还能学会如何利用现代深度学习框架实现自己的CNN模型。
|
7天前
|
机器学习/深度学习 人工智能 算法框架/工具
深度学习中的卷积神经网络(CNN)及其在图像识别中的应用
【10月更文挑战第36天】探索卷积神经网络(CNN)的神秘面纱,揭示其在图像识别领域的威力。本文将带你了解CNN的核心概念,并通过实际代码示例,展示如何构建和训练一个简单的CNN模型。无论你是深度学习的初学者还是希望深化理解,这篇文章都将为你提供有价值的见解。
|
12天前
|
人工智能 自然语言处理 搜索推荐
AI辅助教育:个性化学习的新纪元
【10月更文挑战第31天】随着人工智能(AI)技术的发展,教育领域迎来了一场前所未有的变革。AI辅助教育通过智能推荐、语音助手、评估系统和虚拟助教等应用,实现了个性化学习,提升了教学效率。本文探讨了AI如何重塑教育模式,以及个性化学习在新时代教育中的重要性。
|
14天前
|
机器学习/深度学习 人工智能 自然语言处理
探索AI驱动的个性化学习平台构建###
【10月更文挑战第29天】 本文将深入探讨如何利用人工智能技术,特别是机器学习与大数据分析,构建一个能够提供高度个性化学习体验的在线平台。我们将分析当前在线教育的挑战,提出通过智能算法实现内容定制、学习路径优化及实时反馈机制的技术方案,以期为不同背景和需求的学习者创造更加高效、互动的学习环境。 ###
38 3
|
8天前
|
机器学习/深度学习 人工智能 自动驾驶
深入解析深度学习中的卷积神经网络(CNN)
深入解析深度学习中的卷积神经网络(CNN)
25 0
|
12天前
|
机器学习/深度学习 人工智能 TensorFlow
深度学习中的卷积神经网络(CNN)及其在图像识别中的应用
【10月更文挑战第32天】本文将介绍深度学习中的一个重要分支——卷积神经网络(CNN),以及其在图像识别领域的应用。我们将通过一个简单的代码示例,展示如何使用Python和TensorFlow库构建一个基本的CNN模型,并对其进行训练和测试。
|
1月前
|
机器学习/深度学习 人工智能 算法框架/工具
深度学习中的卷积神经网络(CNN)及其在图像识别中的应用
【10月更文挑战第7天】本文将深入探讨卷积神经网络(CNN)的基本原理,以及它如何在图像识别领域中大放异彩。我们将从CNN的核心组件出发,逐步解析其工作原理,并通过一个实际的代码示例,展示如何利用Python和深度学习框架实现一个简单的图像分类模型。文章旨在为初学者提供一个清晰的入门路径,同时为有经验的开发者提供一些深入理解的视角。
|
9天前
|
机器学习/深度学习 计算机视觉 网络架构
为什么卷积现在不火了:CNN研究热度降温的深层原因分析
纵观近年的顶会论文和研究热点,我们不得不承认一个现实:CNN相关的研究论文正在减少,曾经的"主角"似乎正逐渐淡出研究者的视野。
32 11
为什么卷积现在不火了:CNN研究热度降温的深层原因分析
|
23天前
|
机器学习/深度学习 人工智能 自动驾驶
深度学习中的卷积神经网络(CNN)及其应用
【10月更文挑战第21天】本文旨在深入探讨深度学习领域的核心组成部分——卷积神经网络(CNN)。通过分析CNN的基本结构、工作原理以及在图像识别、语音处理等领域的广泛应用,我们不仅能够理解其背后的技术原理,还能把握其在现实世界问题解决中的强大能力。文章将用浅显的语言和生动的例子带领读者一步步走进CNN的世界,揭示这一技术如何改变我们的生活和工作方式。

热门文章

最新文章