卷积神经网络(二)

本文涉及的产品
实时计算 Flink 版,5000CU*H 3个月
大数据开发治理平台 DataWorks,不限时长
实时数仓Hologres,5000CU*H 100GB 3个月
简介: 卷积神经网络(二)

开发者学习笔记【阿里云人工智能工程师ACA认证(2023版):卷积神经网络(二)

课程地址:https://edu.aliyun.com/course/3112108/lesson/19268

 

卷积神经网络(二)


三、经典卷积神经网络

图片526.png

下面我们来了解几个经典的卷积神经网络。经典的卷积神经网络主要介绍第一个网络。这个网络是开创性的,最早提出的卷积神经网络之一。

开山之作--LeNet-5

.于上世纪90年代提出,第一个卷积神经网络;共包含7层网络结构,分别为2个卷积层、2个池化层、2个全连接层和1个输出层;

卷积核大小全部为5*5。

王者归来--AlexNet

在2012年的ImageNetILSVRC竞赛中以Top5错误率16.4%夺

得冠军;共包含8层网络结构,分别为5层卷积层和3层全连接层;

卷积核大小分别为11*11.5*5和3*3。

里程碑式创新--ResNet

残差网络(Residual Network)是ILSVRC2015的胜利者;共包含152层网络结构,分别为151层卷积层和1层全连接层;它使用了跳跃链接,并大量使用了批量归一化。

这个网络最早在2012年取得了突破性的成功。它在一个图像分类竞赛中获得了冠军,并且由于其出色的性能,开始引起了广泛的关注。

对于分类问题,输出层的每个节点代表一个类别的标签。这个网络在早期被广泛应用于手写数字识别等任务,其输入是经过预处理的32x32图像,输出是10个类别中每个类别的概率。网络的输出表示了输入图像属于每个类别的概率。对于目标检测问题,输出层的输出可能包括目标的位置、大小和所属类别。如果是图像分割任务,输出层的每个像素都可以表示为属于哪个类别,这取决于具体的应用场景和网络设计。

希望这些解释能帮助您更好地理解卷积神经网络的结构和功能。如果您需要更多信息或有其他问题,请随时提出。

图片527.png


当然,这个网络也是卷积神经网络,与之前我们讨论的网络相比,实际上有许多共通之处,可以看作是一个更大、更复杂的卷积神经网络的扩展。然而,尽管这么说,但实际上,它具有独特之处,因为它的规模非常大,解决的问题也更加复杂,思路也有所不同。下面我们来看一些它的介绍。

首先,它采用了许多现代卷积神经网络的技术方法,比如使用GPU进行并行训练,使用非线性激活函数,以及采用防止过拟合的方法,同时也使用了数据增强来提高模型的准确性。这些都是现代深度学习网络常用的技术方法。与之前的网络相比,它的训练方法和技术更加先进。

然而,它面临的问题也更为复杂,因为它处理的数据集规模更大。相对于之前的手写数字识别数据集,这个网络面对的数据集规模庞大,包含数百万张图像,而且识别任务更加复杂。此外,它采用了先进的卷积技术和更深的全连接层,使得网络更加复杂。

这个网络的突破对深度学习领域产生了深远的影响,它启发了许多后续的研究工作,推动了深度学习的发展。因此,从某种意义上说,它代表了深度学习领域不断前行的方向,不断创新和进步。

现在让我们更详细地了解一下这个网络的结构。它使用了一个包含152层的深度神经网络,这个数字代表了网络的深度。这个网络的设计和训练是一项庞大的工程,但它的结果表明,深度神经网络在处理复杂问题和大规模数据集方面具有巨大的潜力。

图片528.png


在某种程度上,这个问题的解决要从一开始谈起。自从深度学习开始兴起以来,人们开始认识到神经网络的深度对其性能有着重要影响。深度的增加可以提高性能,但并不是层数越多就一定效果越好。一旦层数增加到一定程度,网络容量实际上会下降,导致学习速度减慢,甚至在更深层次时,准确率可能下降。这有点像一个学生在上补习班之前,学习成绩还不错,但随着补习班的堆积,效果可能反而会下降。因此,我们不能无限地增加网络的层数,否则效果会受到影响。

然而,通过使用renet技术,这个问题得以解决。深度学习的深度可以不断增加而不会出现这种问题。renet的特点是能够优化网络并增加相当深的层数,从而提高准确率。在进行训练和测试时,网络的深度可以增加到数百层。尽管深度很大,但效果并不一定很好,百多层的深度可能更适中,以避免过拟合等问题。

综上所述,通过renet技术,网络的深度可以扩大,使深度学习真正成为可能。这一原理通过超越连接得以实现,有助于克服增加深度时可能出现的问题。这个方法虽然看起来简单,但具有重大意义,尤其在机器视觉领域已经达到了超越人眼水平的性能水平。

 

四、卷积神经网络的应用


图片529.png


卷积神经网络在各个领域都有广泛的应用。首先,它在图像分类方面表现出色。通过卷积操作,它能够有效地提取图像中的特征,使得图像分类任务更为精确。

此外,卷积神经网络在语音识别和机器翻译方面也发挥着重要作用。尽管它最初是为处理二维数据而设计的,但它也适用于不同维度的数据,具有广泛的应用领域。当处理一维数据时,通常用于序列模型,例如自然语言处理任务。在文本处理方面,卷积神经网络可用于文本分类和情感分析,同时也可以应用于语音识别,例如将会议中的实时音频转化为文本,以提高会议效率并记录会议内容。

总的来说,卷积神经网络的应用涵盖了多个领域,包括图像处理、自然语言处理和语音识别,为这些领域的问题提供了有效的解决方案。

图片530.png


二维卷积神经网络在图像处理和计算机视觉领域有广泛的应用,包括图像分类、目标识别以及垃圾分类等任务。例如,它可以用于垃圾分类技术,通过视觉识别判断垃圾属于哪一类。另一个应用是车牌识别,通过识别车牌号码来实现自动化管理。

图像搜索也是一个重要的应用领域,例如阿里的淘宝和天猫产品中的图像搜索功能,允许用户通过拍摄想要购买的商品,然后迅速搜索出相似的商品。

此外,卷积神经网络在医学领域和视频处理领域也有广泛应用。在医学领域,它可以协助医生快速进行CT图像的病情检测,提高医疗诊断效率。在视频处理领域,考虑到视频是三维数据,还包含时间维度,卷积神经网络可以用于检测用户的动作或行为,例如阿里提供的智能识别功能。

图片531.png


在家庭监控中,可以使用卷积神经网络进行识别。如果有人出现在监控画面中,可以使用这种技术,就像没有保安一样。此外,还可以进行表情识别,利用AI来提高安全价值。

 

本节回顾

通过本节的学习,我们学到了:

1、卷积神经网络的概述

一种带有毒积结构的深度神经网络,通过特证提取和分类识制完成对转入数据产

2、卷积神经网络的层级结构

输入层即接收数据的输入,可以处理多维数获,也能对输入特征进行标准化处理,有利于提升卷积种经网络的学习效零和表现

卷机层提取一个民部区域的特征,不同的程行核相当于不同的特征提取器

池化层对政据进行降值,减少数统特征,减少网络参数和运算次数,避免过拟合,常用方法有最大值池化和均值

全连接层神经元排成一列,这些神经元与前一层神经元通过权值互连,星全链接结构

输出层通常是是全连接层,因此其结机和工作原理与传统前馈神经网结中的域出层相同通过本节的学习

3、经典卷积神经网络

开山之作-LeNet-5

王者归来--AlexNet

里程碑式创新--ResNet

4、卷积神经网络的应用

一维卷积序列模型、自然语处理模型

二维卷积图像处理、计算机视觉领域

三维卷积医学领域、视频处理领域

相关文章
|
22天前
|
机器学习/深度学习 人工智能 算法
海洋生物识别系统+图像识别+Python+人工智能课设+深度学习+卷积神经网络算法+TensorFlow
海洋生物识别系统。以Python作为主要编程语言,通过TensorFlow搭建ResNet50卷积神经网络算法,通过对22种常见的海洋生物('蛤蜊', '珊瑚', '螃蟹', '海豚', '鳗鱼', '水母', '龙虾', '海蛞蝓', '章鱼', '水獭', '企鹅', '河豚', '魔鬼鱼', '海胆', '海马', '海豹', '鲨鱼', '虾', '鱿鱼', '海星', '海龟', '鲸鱼')数据集进行训练,得到一个识别精度较高的模型文件,然后使用Django开发一个Web网页平台操作界面,实现用户上传一张海洋生物图片识别其名称。
113 7
海洋生物识别系统+图像识别+Python+人工智能课设+深度学习+卷积神经网络算法+TensorFlow
|
15天前
|
机器学习/深度学习 人工智能 算法
【乐器识别系统】图像识别+人工智能+深度学习+Python+TensorFlow+卷积神经网络+模型训练
乐器识别系统。使用Python为主要编程语言,基于人工智能框架库TensorFlow搭建ResNet50卷积神经网络算法,通过对30种乐器('迪吉里杜管', '铃鼓', '木琴', '手风琴', '阿尔卑斯号角', '风笛', '班卓琴', '邦戈鼓', '卡萨巴', '响板', '单簧管', '古钢琴', '手风琴(六角形)', '鼓', '扬琴', '长笛', '刮瓜', '吉他', '口琴', '竖琴', '沙槌', '陶笛', '钢琴', '萨克斯管', '锡塔尔琴', '钢鼓', '长号', '小号', '大号', '小提琴')的图像数据集进行训练,得到一个训练精度较高的模型,并将其
27 0
【乐器识别系统】图像识别+人工智能+深度学习+Python+TensorFlow+卷积神经网络+模型训练
|
6天前
|
机器学习/深度学习 数据采集 算法
Python基于OpenCV和卷积神经网络CNN进行车牌号码识别项目实战
Python基于OpenCV和卷积神经网络CNN进行车牌号码识别项目实战
41 19
|
6天前
|
机器学习/深度学习 编解码
深度之眼(二十八)——神经网络基础知识(三)-卷积神经网络
深度之眼(二十八)——神经网络基础知识(三)-卷积神经网络
28 14
|
1天前
|
机器学习/深度学习 PyTorch 算法框架/工具
图神经网络是一类用于处理图结构数据的神经网络。与传统的深度学习模型(如卷积神经网络CNN和循环神经网络RNN)不同,
图神经网络是一类用于处理图结构数据的神经网络。与传统的深度学习模型(如卷积神经网络CNN和循环神经网络RNN)不同,
15 9
|
22天前
|
机器学习/深度学习 人工智能 算法
【昆虫识别系统】图像识别Python+卷积神经网络算法+人工智能+深度学习+机器学习+TensorFlow+ResNet50
昆虫识别系统,使用Python作为主要开发语言。通过TensorFlow搭建ResNet50卷积神经网络算法(CNN)模型。通过对10种常见的昆虫图片数据集('蜜蜂', '甲虫', '蝴蝶', '蝉', '蜻蜓', '蚱蜢', '蛾', '蝎子', '蜗牛', '蜘蛛')进行训练,得到一个识别精度较高的H5格式模型文件,然后使用Django搭建Web网页端可视化操作界面,实现用户上传一张昆虫图片识别其名称。
170 7
【昆虫识别系统】图像识别Python+卷积神经网络算法+人工智能+深度学习+机器学习+TensorFlow+ResNet50
|
16天前
|
机器学习/深度学习 计算机视觉 网络架构
【YOLOv8改进-卷积Conv】DualConv( Dual Convolutional):用于轻量级深度神经网络的双卷积核
**摘要:** 我们提出DualConv,一种融合$3\times3$和$1\times1$卷积的轻量级DNN技术,适用于资源有限的系统。它通过组卷积结合两种卷积核,减少计算和参数量,同时增强准确性。在MobileNetV2上,参数减少54%,CIFAR-100精度仅降0.68%。在YOLOv3中,DualConv提升检测速度并增4.4%的PASCAL VOC准确性。论文及代码已开源。
|
14天前
|
机器学习/深度学习 PyTorch 算法框架/工具
【YOLOv8改进 - 注意力机制】SimAM:轻量级注意力机制,解锁卷积神经网络新潜力
YOLO目标检测专栏介绍了SimAM,一种无参数的CNN注意力模块,基于神经科学理论优化能量函数,提升模型表现。SimAM通过计算3D注意力权重增强特征表示,无需额外参数。文章提供论文链接、Pytorch实现代码及详细配置,展示了如何在目标检测任务中应用该模块。
|
6天前
|
机器学习/深度学习 数据采集 算法
Python基于卷积神经网络CNN模型和VGG16模型进行图片识别项目实战
Python基于卷积神经网络CNN模型和VGG16模型进行图片识别项目实战
|
10天前
|
机器学习/深度学习 物联网 区块链
未来触手可及:探索区块链、物联网和虚拟现实的革新之路探索深度学习中的卷积神经网络(CNN)
随着科技的飞速发展,新兴技术如区块链、物联网(IoT)和虚拟现实(VR)正不断重塑我们的工作和生活方式。本文将深入探讨这些技术的最新发展趋势,分析它们如何在不同行业实现应用革新,并预测其未来的融合潜力。我们将从技术的基本原理出发,通过案例研究,揭示它们在现实世界中的创新应用场景,并讨论面临的挑战与机遇。 在机器学习领域,卷积神经网络(CNN)已成为图像识别和处理的基石。本文深入探讨了CNN的核心原理、架构以及在多个领域的应用实例,旨在为读者提供从理论到实践的全面理解。

相关实验场景

更多