DL:深度学习(神经网络)的简介、基础知识(神经元/感知机、训练策略、预测原理)、算法分类、经典案例应用之详细攻略

简介: 深度学习(Deep Learning, DL)或阶层学习(hierarchical learning)是机器学习的技术和研究领域之一,通过建立具有阶层结构的人工神经网络(Artifitial Neural Networks, ANNs),在计算系统中实现人工智能 。由于阶层ANN能够对输入信息进行逐层提取和筛选,因此深度学习具有表征学习(representation learning)能力 ,可以实现端到端的监督学习和非监督学习 。此外,深度学习也可参与构建强化学习(reinforcement learning)系统,形成深度强化学习 。

 DL:深度学习(神经网络)的简介、基础知识(神经元/感知机、训练策略、预测原理)、算法分类、经典案例应用之详细攻略

目录

深度学习(神经网络)的简介

1、深度学习浪潮兴起的三大因素

深度学习(神经网络)的基础知识(相关概念、训练策略)

1、神经网络的基础知识

2、神经元的结构

3、感知机

4、万能逼近定理

5、神经网络训练

6、神经网络学习

7、神经网络的前馈运算与反向传播

8、激活函数

深度学习(神经网络)的算法分类

1、常用的神经网络模型概览

深度学习(神经网络)的经典案例应用


深度学习(神经网络)的简介

      深度学习(Deep Learning, DL)或阶层学习(hierarchical learning)是机器学习的技术和研究领域之一,通过建立具有阶层结构的人工神经网络(Artifitial Neural Networks, ANNs),在计算系统中实现人工智能  。由于阶层ANN能够对输入信息进行逐层提取和筛选,因此深度学习具有表征学习(representation learning)能力 ,可以实现端到端的监督学习和非监督学习 。此外,深度学习也可参与构建强化学习(reinforcement learning)系统,形成深度强化学习  。

      深度学习所使用的阶层ANN具有多种形态,其阶层的复杂度被通称为“深度” 。按构筑类型,深度学习的形式包括多层感知器、卷积神经网络、循环神经网络、深度置信网络和其它混合构筑  。深度学习使用数据对其构筑中的参数进行更新以达成训练目标,该过程被通称为“学习”  。学习的常见方法为梯度下降算法及其变体 ,一些统计学习理论被用于学习过程的优化 [9]  。

       在应用方面,深度学习被用于对复杂结构和大样本的高维数据进行学习,按研究领域包括计算机视觉、自然语言处理、生物信息学、自动控制等,且在人像识别、机器翻译、自动驾驶等现实问题中取得了成功。

1、深度学习浪潮兴起的三大因素

    • 海量的数据
    • 不断提升的算法能力
    • 高性能计算硬件的实现:GPU、TPU


    深度学习(神经网络)的基础知识(相关概念、训练策略)

          深度学习的实质是构建具有多个隐藏层的机器学习模型,通过海量的训练数据来学习更有用的特征,从而最终提升分类或预测的准确性。“深度模型”是手段“表示学习”是目的

          深度学习与传统的浅层学习的不同在于:

      • (1) 强调了模型结构的深度,有2层以上的隐藏层;
      • (2) 明确突出了表示学习的重要性。通过逐层特征变换,将样本在原空间的特征表示变换到一个新的特征空间,使分类或预测更加容易。

      image.gif

      DL之DNN优化技术:神经网络算法简介之GD/SGD算法的简介、代码实现、代码调参之详细攻略

      DL之DNN:BP类神经网络理解之不需要额外任何文字,只需要八张图讲清楚BP类神经网络的工作原理

      1、神经网络的基础知识

        • 神经元
        • 感知机
        • 激活函数:Sigmoid、tanh、ReLU、Leaky ReLU、ELU、Softmax。
        • 多层感知机:
        • 万能逼近定理:

        2、神经元的结构

        生物神经元包括细胞体和突起两个部分,突起又包括树突(接收信号)和轴突(传出信号)。

          • 轴突记录了神经元间联系的强弱。只有达到一定的兴奋程度,神经元才向外界传输信息。
          • 神经元之间的信号通过突触传递。

          image.gif

          3、感知机

          DL之Perceptron:Perceptron感知器(感知机/多层感知机/人工神经元)的简介、原理、案例应用(相关配图)之详细攻略

          4、万能逼近定理

           (Universal approximation theorem)

            • 只需一个包含单个隐藏层的前馈神经网络,即可逼近任意一个连续函数
            • 尽管仅有一个隐藏层的前馈网络足以表示任何函数,但是该隐藏层的神经元数目可能非常多,从而导致网络无法学习或正确泛化。

            5、神经网络训练

            (1)、损失函数:

            平均损失函数

            绝对值损失函数

            交叉熵损失函数:softmax回归,独热编码。

            (2)、优化目标

            (3)、梯度下降:

                • 梯度下降各种优化算法:Momentum、NAG、Adagrad、Adadelta、RMSprop、Adam

                (4)、反向传播法:计算图解释

                1、神经网络训练的优化目标

                image.gif

                6、神经网络学习

                (1)、通过调整神经元的参数,使得网络对给定输入可产生期望输出。

                image.gif

                (2)、学习层次化的表示(表征)

                    image.gif

                7、神经网络的前馈运算与反向传播

                前馈运算和反向传播:在训练网络过程中所使用的。如果经过训练模型,网络稳定下来以后,就可以把参数固定下来,此时就不再需要反向传播了,只需要前馈运算进行推理和预测即可!

                 

                image.gif

                8、激活函数

                DL学习—AF:理解机器学习中常用的激活函数(sigmoid、softmax等)简介、应用、计算图实现、代码实现详细攻略

                深度学习(神经网络)的算法分类

                        深度学习的形式包括多层感知器、卷积神经网络、循环神经网络、深度置信网络和其它混合构筑  。

                         前馈神经网络(NN),而是和循环神经网络(RNN)的概念是相对的。而反向传播方法可以用在FF网络中,此时,基于反向传播算法的前馈神经网络,被称为BP神经网络。

                1、常用的神经网络模型概览

                DL:神经网络所有模型(包括DNN、CNN、RNN等)的简介(概览)、网络结构简介、使用场景对比之详细攻略

                1、DNN

                DL之DNN:DNN深度神经网络算法的简介、相关论文、设计思路、关键步骤、实现代码等配图集合之详细攻略

                2、CNN

                DL之CNN:计算机视觉卷积神经网络算法CNN算法常见结构、发展、CNN优化技术、案例应用之详细攻略

                3、RNN

                DL之RNN:RNN算法的简介、相关论文、相关思路、关键步骤、配图集合+TF代码定义之详细攻略

                4、DBN

                深度学习(神经网络)的经典案例应用

                后期更新……


                相关文章
                |
                1月前
                |
                机器学习/深度学习 PyTorch 算法框架/工具
                目标检测实战(一):CIFAR10结合神经网络加载、训练、测试完整步骤
                这篇文章介绍了如何使用PyTorch框架,结合CIFAR-10数据集,通过定义神经网络、损失函数和优化器,进行模型的训练和测试。
                86 2
                目标检测实战(一):CIFAR10结合神经网络加载、训练、测试完整步骤
                |
                1月前
                |
                机器学习/深度学习 算法 测试技术
                深度学习环境搭建笔记(二):mmdetection-CPU安装和训练
                本文是关于如何搭建深度学习环境,特别是使用mmdetection进行CPU安装和训练的详细指南。包括安装Anaconda、创建虚拟环境、安装PyTorch、mmcv-full和mmdetection,以及测试环境和训练目标检测模型的步骤。还提供了数据集准备、检查和网络训练的详细说明。
                84 5
                深度学习环境搭建笔记(二):mmdetection-CPU安装和训练
                |
                1月前
                |
                机器学习/深度学习 数据可视化 计算机视觉
                目标检测笔记(五):详细介绍并实现可视化深度学习中每层特征层的网络训练情况
                这篇文章详细介绍了如何通过可视化深度学习中每层特征层来理解网络的内部运作,并使用ResNet系列网络作为例子,展示了如何在训练过程中加入代码来绘制和保存特征图。
                56 1
                目标检测笔记(五):详细介绍并实现可视化深度学习中每层特征层的网络训练情况
                |
                6天前
                |
                机器学习/深度学习 人工智能 算法框架/工具
                深度学习中的卷积神经网络(CNN)及其在图像识别中的应用
                【10月更文挑战第36天】探索卷积神经网络(CNN)的神秘面纱,揭示其在图像识别领域的威力。本文将带你了解CNN的核心概念,并通过实际代码示例,展示如何构建和训练一个简单的CNN模型。无论你是深度学习的初学者还是希望深化理解,这篇文章都将为你提供有价值的见解。
                |
                10天前
                |
                机器学习/深度学习 移动开发 自然语言处理
                HTML5与神经网络技术的结合有哪些其他应用
                HTML5与神经网络技术的结合有哪些其他应用
                26 3
                |
                14天前
                |
                机器学习/深度学习 自然语言处理 并行计算
                DeepSpeed分布式训练框架深度学习指南
                【11月更文挑战第6天】随着深度学习模型规模的日益增大,训练这些模型所需的计算资源和时间成本也随之增加。传统的单机训练方式已难以应对大规模模型的训练需求。
                56 3
                |
                17天前
                |
                机器学习/深度学习 存储 运维
                图神经网络在复杂系统中的应用
                图神经网络(Graph Neural Networks, GNNs)是一类专门处理图结构数据的深度学习模型,近年来在复杂系统的研究和应用中展现了强大的潜力。复杂系统通常涉及多个相互关联的组件,其行为和特性难以通过传统方法进行建模和分析。
                40 3
                |
                16天前
                |
                分布式计算 Java 开发工具
                阿里云MaxCompute-XGBoost on Spark 极限梯度提升算法的分布式训练与模型持久化oss的实现与代码浅析
                本文介绍了XGBoost在MaxCompute+OSS架构下模型持久化遇到的问题及其解决方案。首先简要介绍了XGBoost的特点和应用场景,随后详细描述了客户在将XGBoost on Spark任务从HDFS迁移到OSS时遇到的异常情况。通过分析异常堆栈和源代码,发现使用的`nativeBooster.saveModel`方法不支持OSS路径,而使用`write.overwrite().save`方法则能成功保存模型。最后提供了完整的Scala代码示例、Maven配置和提交命令,帮助用户顺利迁移模型存储路径。
                |
                21天前
                |
                机器学习/深度学习 人工智能 自动驾驶
                深度学习中的卷积神经网络(CNN)及其应用
                【10月更文挑战第21天】本文旨在深入探讨深度学习领域的核心组成部分——卷积神经网络(CNN)。通过分析CNN的基本结构、工作原理以及在图像识别、语音处理等领域的广泛应用,我们不仅能够理解其背后的技术原理,还能把握其在现实世界问题解决中的强大能力。文章将用浅显的语言和生动的例子带领读者一步步走进CNN的世界,揭示这一技术如何改变我们的生活和工作方式。
                |
                28天前
                |
                机器学习/深度学习 自然语言处理 自动驾驶
                神经网络有哪些应用场景呢
                【10月更文挑战第14天】神经网络有哪些应用场景呢