可视化解释11种基本神经网络架构

简介: 随着深度学习的飞速发展,已经创建了完整的神经网络体系结构主机,以解决各种各样的任务和问题。 尽管有无数的神经网络架构,但对于任何深度学习工程师来说,这里有11种必不可少的知识,它们分为四大类:标准网络,递归网络,卷积网络和自动编码器。

--------点击屏幕右侧或者屏幕底部“+订阅”,关注我,随时分享机器智能最新行业动态及技术干货----------

image.png

标准,循环,卷积和自动编码器网络

随着深度学习的飞速发展,已经创建了完整的神经网络体系结构主机,以解决各种各样的任务和问题。 尽管有无数的神经网络架构,但对于任何深度学习工程师来说,这里有11种必不可少的知识,它们分为四大类:标准网络,递归网络,卷积网络和自动编码器。

标准网络

1 | 感知器

感知器是所有神经网络中最基础的,是更复杂的神经网络的基本构建块。 它仅连接输入单元和输出单元。

image.png

2 | 前馈网络

前馈网络是感知器的集合,其中存在三种基本类型的层-输入层,隐藏层和输出层。 在每个连接期间,来自上一层的信号乘以权重,加到偏置上,并通过激活函数。 前馈网络使用反向传播来迭代更新参数,直到达到理想的性能为止。

image.png

3 | 残留网络(ResNet)

深度前馈神经网络的一个问题称为消失梯度问题,即当网络太长而无法在整个网络中反向传播有用信息时。 随着更新参数的信号通过网络传播,它逐渐减小,直到网络前端的权重完全没有改变或被利用为止。

为了解决这个问题,残差网络采用了跳过连接,可以跨"跳跃的"层传播信号。 通过使用不太容易受到影响的连接,可以减少消失的梯度问题。 随着时间的流逝,网络在学习特征空间时会学习恢复跳过的图层,但由于其不易受到梯度消失的影响并且需要探索较少的特征空间,因此训练效率更高。

image.png

循环网络

4 | 递归神经网络(RNN)

递归神经网络是一种特殊类型的网络,它包含循环并在其自身上递归,因此称为"递归"。 RNN允许将信息存储在网络中,使用先前训练中的推理来做出有关即将发生的事件的更好,更明智的决策。 为此,它将先前的预测用作"上下文信号"。 由于其性质,RNN通常用于处理顺序任务,例如逐个字母生成文本或预测时间序列数据(例如股票价格)。 他们还可以处理任何大小的输入。

image.png

5 | 长期短期记忆网络(LSTM)

RNN存在问题,因为实际上上下文信息的范围非常有限。 给定输入对隐藏层(因此对网络输出)的影响(反向传播错误),要么呈指数级爆发,要么随着绕网络连接循环而消失为零。 解决这个逐渐消失的梯度问题的方法是使用长短期内存网络或LSTM。

这种RNN架构是专门为解决消失的梯度问题而设计的,将结构与存储块配合在一起。 这些模块可以看作是计算机中的存储芯片-每个模块都包含几个循环连接的存储单元和三个门(输入,输出和忘记,相当于写入,读取和重置)。 网络只能通过每个门与单元交互,因此门学会了智能地打开和关闭,以防止梯度爆炸或消失,而且还可以通过"恒定错误轮播"传播有用的信息,并丢弃无关的存储内容。

image.png

在标准RNN无法得知输入事件与目标信号之间存在大于五到十个时间步长的时滞的情况下,LSTM不会受到影响,并且可以通过强制执行有用的恒定错误流来学习将时滞甚至连成1,000个时步。

6 | 回声状态网(ESN)

回声状态网络是递归神经网络的一种变体,具有非常稀疏的隐藏层(通常为百分之一的连接性)。 神经元的连通性和权重是随机分配的,并且忽略层和神经元的差异(跳过连接)。 学习输出神经元的权重,以便网络可以产生和再现特定的时间模式。 该网络背后的理由来自这样一个事实:尽管它是非线性的,但训练过程中唯一修改的权重是突触连接,因此可以将误差函数区分为线性系统。

image.png

卷积网络

7 | 卷积神经网络(CNN)

图像具有很高的维数,因此训练一个标准的前馈网络来识别图像将需要成千上万的输入神经元,除了公然高昂的计算费用外,还可能引起许多与神经网络的维数诅咒相关的问题 。 卷积神经网络(CNN)通过使用卷积层和池化层来帮助降低图像的维数,从而提供了解决方案。 由于卷积层是可训练的,但是比标准隐藏层具有更少的参数,因此它能够突出显示图像的重要部分并将它们向前传递。 传统上,在CNN中,最后几层是隐藏层,用于处理"压缩图像信息"。

image.png

卷积神经网络在基于图像的任务上表现出色,例如将图像分类为狗或猫。

8 | 反卷积神经网络(DNN)

顾名思义,反卷积神经网络的作用与卷积神经网络相反。 DNN不是执行卷积来减小图像的维数,而是利用反卷积来创建图像,通常是根据噪声来进行的。 这是一项固有的艰巨任务。 考虑CNN的任务是为奥威尔(Orwell)1984年的整本书写一个三句摘要,而DNN的任务是从三句结构写整个本书。

image.png

9 | 生成对抗网络(GAN)

生成对抗网络是一种专门设计用于生成图像的特殊类型的网络,它由两个网络(一个鉴别器和一个生成器)组成。 区分者的任务是区分是从数据集中提取图像还是由生成器生成图像,而生成者的任务是生成足够有说服力的图像,以使区分器无法区分其是否真实。

随着时间的流逝,经过精心的监管,这两个对手彼此竞争,互相推动,成功地改善了彼此。 最终结果是训练有素的生成器,可以吐出逼真的图像。 鉴别器是一个卷积神经网络,其目的是最大程度地提高识别真实/伪造图像的准确性,而生成器是一个反卷积神经网络,其目的是最小化鉴别器的性能。

image.png

> Generator diagram.

自动编码器

10 | 自动编码器(AE)

自动编码器的基本思想是获取原始的高维数据,将其"压缩"为高度信息化的低维数据,然后将压缩后的形式投影到新的空间中。 自动编码器有许多应用,包括降维,图像压缩,去噪数据,特征提取,图像生成和推荐系统。 它既可以作为无监督方法也可以作为有监督方法,可以非常洞悉数据的性质。

image.png

隐藏的单元可以用卷积层替换以适应处理图像。

11 | 可变自动编码器(VAE)

自动编码器学习输入的压缩表示形式,例如可以是图像或文本序列,方法是压缩输入然后将其解压缩以匹配原始输入,而变分自动编码器(VAE)学习概率分布的参数 代表数据。 它不仅仅是学习表示数据的函数,还获得了更详细,细致的数据视图,从分布中采样并生成新的输入数据样本。 从这个意义上讲,它更像是一种纯粹的"生成"模型,例如GAN。

image.png

VAE使用概率隐藏单元格,该单元格将径向基函数应用于测试用例与单元格均值之间的差异。

image.png

文章来源:https://bigdata.51cto.com/art/202007/619992.htm
文章转自51cto,本文一切观点和《机器智能技术》圈子无关

目录
相关文章
|
7月前
|
运维 监控 数据可视化
Python 网络请求架构——统一 SOCKS5 接入与配置管理
通过统一接入端点与标准化认证,集中管理配置、连接策略及监控,实现跨技术栈的一致性网络出口,提升系统稳定性、可维护性与可观测性。
|
小程序 前端开发
2025商业版拓展校园圈子论坛网络的创新解决方案:校园跑腿小程序系统架构
校园跑腿小程序系统是一款创新解决方案,旨在满足校园配送需求并拓展校友网络。跑腿员可接单配送,用户能实时跟踪订单并评价服务。系统包含用户、客服、物流、跑腿员及订单模块,功能完善。此外,小程序增设信息咨询发布、校园社区建设和活动组织等功能,助力校友互动、经验分享及感情联络,构建紧密的校友网络。
439 1
2025商业版拓展校园圈子论坛网络的创新解决方案:校园跑腿小程序系统架构
|
12月前
|
人工智能 监控 安全
NTP网络子钟的技术架构与行业应用解析
在数字化与智能化时代,时间同步精度至关重要。西安同步电子科技有限公司专注时间频率领域,以“同步天下”品牌提供可靠解决方案。其明星产品SYN6109型NTP网络子钟基于网络时间协议,实现高精度时间同步,广泛应用于考场、医院、智慧场景等领域。公司坚持技术创新,产品通过权威认证,未来将结合5G、物联网等技术推动行业进步,引领精准时间管理新时代。
|
机器学习/深度学习 计算机视觉 iOS开发
RT-DETR改进策略【模型轻量化】| 替换骨干网络 CVPR-2024 RepViT 轻量级的Vision Transformers架构
RT-DETR改进策略【模型轻量化】| 替换骨干网络 CVPR-2024 RepViT 轻量级的Vision Transformers架构
971 0
RT-DETR改进策略【模型轻量化】| 替换骨干网络 CVPR-2024 RepViT 轻量级的Vision Transformers架构
|
10月前
|
人工智能 监控 数据可视化
企业级LLMOps落地指南:蜂巢架构×可视化编排实战
本文将基础的单应用扩展成多应用,并实现工作流组件,包括:多应用模块设计、工作流模块设计、LangGraph实现图应用、前端Vue-Flow组件使用、工作流转LLM工具设计思路、关联工作流登技巧。
494 3
企业级LLMOps落地指南:蜂巢架构×可视化编排实战
|
12月前
|
机器学习/深度学习 算法 测试技术
图神经网络在信息检索重排序中的应用:原理、架构与Python代码解析
本文探讨了基于图的重排序方法在信息检索领域的应用与前景。传统两阶段检索架构中,初始检索速度快但结果可能含噪声,重排序阶段通过强大语言模型提升精度,但仍面临复杂需求挑战
442 0
图神经网络在信息检索重排序中的应用:原理、架构与Python代码解析
|
NoSQL 关系型数据库 MySQL
《docker高级篇(大厂进阶):4.Docker网络》包括:是什么、常用基本命令、能干嘛、网络模式、docker平台架构图解
《docker高级篇(大厂进阶):4.Docker网络》包括:是什么、常用基本命令、能干嘛、网络模式、docker平台架构图解
551 56
《docker高级篇(大厂进阶):4.Docker网络》包括:是什么、常用基本命令、能干嘛、网络模式、docker平台架构图解
|
Cloud Native 区块链 数据中心
Arista CloudEOS 4.32.2F - 云网络基础架构即代码
Arista CloudEOS 4.32.2F - 云网络基础架构即代码
276 1
|
机器学习/深度学习 测试技术 网络架构
FANformer:融合傅里叶分析网络的大语言模型基础架构
近期大语言模型(LLM)的基准测试结果显示,OpenAI的GPT-4.5在某些关键评测中表现不如规模较小的模型,如DeepSeek-V3。这引发了对现有LLM架构扩展性的思考。研究人员提出了FANformer架构,通过将傅里叶分析网络整合到Transformer的注意力机制中,显著提升了模型性能。实验表明,FANformer在处理周期性模式和数学推理任务上表现出色,仅用较少参数和训练数据即可超越传统Transformer。这一创新为解决LLM扩展性挑战提供了新方向。
436 5
FANformer:融合傅里叶分析网络的大语言模型基础架构
|
机器学习/深度学习 数据可视化 PyTorch
深入解析图神经网络注意力机制:数学原理与可视化实现
本文深入解析了图神经网络(GNNs)中自注意力机制的内部运作原理,通过可视化和数学推导揭示其工作机制。文章采用“位置-转移图”概念框架,并使用NumPy实现代码示例,逐步拆解自注意力层的计算过程。文中详细展示了从节点特征矩阵、邻接矩阵到生成注意力权重的具体步骤,并通过四个类(GAL1至GAL4)模拟了整个计算流程。最终,结合实际PyTorch Geometric库中的代码,对比分析了核心逻辑,为理解GNN自注意力机制提供了清晰的学习路径。
886 7
深入解析图神经网络注意力机制:数学原理与可视化实现