DL:深度学习(神经网络)的简介、基础知识(神经元/感知机、训练策略、预测原理)、算法分类、经典案例应用之详细攻略

简介: 深度学习(Deep Learning, DL)或阶层学习(hierarchical learning)是机器学习的技术和研究领域之一,通过建立具有阶层结构的人工神经网络(Artifitial Neural Networks, ANNs),在计算系统中实现人工智能 。由于阶层ANN能够对输入信息进行逐层提取和筛选,因此深度学习具有表征学习(representation learning)能力 ,可以实现端到端的监督学习和非监督学习 。此外,深度学习也可参与构建强化学习(reinforcement learning)系统,形成深度强化学习 。

 DL:深度学习(神经网络)的简介、基础知识(神经元/感知机、训练策略、预测原理)、算法分类、经典案例应用之详细攻略

目录

深度学习(神经网络)的简介

1、深度学习浪潮兴起的三大因素

深度学习(神经网络)的基础知识(相关概念、训练策略)

1、神经网络的基础知识

2、神经元的结构

3、感知机

4、万能逼近定理

5、神经网络训练

6、神经网络学习

7、神经网络的前馈运算与反向传播

8、激活函数

深度学习(神经网络)的算法分类

1、常用的神经网络模型概览

深度学习(神经网络)的经典案例应用


深度学习(神经网络)的简介

      深度学习(Deep Learning, DL)或阶层学习(hierarchical learning)是机器学习的技术和研究领域之一,通过建立具有阶层结构的人工神经网络(Artifitial Neural Networks, ANNs),在计算系统中实现人工智能  。由于阶层ANN能够对输入信息进行逐层提取和筛选,因此深度学习具有表征学习(representation learning)能力 ,可以实现端到端的监督学习和非监督学习 。此外,深度学习也可参与构建强化学习(reinforcement learning)系统,形成深度强化学习  。

      深度学习所使用的阶层ANN具有多种形态,其阶层的复杂度被通称为“深度” 。按构筑类型,深度学习的形式包括多层感知器、卷积神经网络、循环神经网络、深度置信网络和其它混合构筑  。深度学习使用数据对其构筑中的参数进行更新以达成训练目标,该过程被通称为“学习”  。学习的常见方法为梯度下降算法及其变体 ,一些统计学习理论被用于学习过程的优化 [9]  。

       在应用方面,深度学习被用于对复杂结构和大样本的高维数据进行学习,按研究领域包括计算机视觉、自然语言处理、生物信息学、自动控制等,且在人像识别、机器翻译、自动驾驶等现实问题中取得了成功。

1、深度学习浪潮兴起的三大因素

    • 海量的数据
    • 不断提升的算法能力
    • 高性能计算硬件的实现:GPU、TPU


    深度学习(神经网络)的基础知识(相关概念、训练策略)

          深度学习的实质是构建具有多个隐藏层的机器学习模型,通过海量的训练数据来学习更有用的特征,从而最终提升分类或预测的准确性。“深度模型”是手段“表示学习”是目的

          深度学习与传统的浅层学习的不同在于:

      • (1) 强调了模型结构的深度,有2层以上的隐藏层;
      • (2) 明确突出了表示学习的重要性。通过逐层特征变换,将样本在原空间的特征表示变换到一个新的特征空间,使分类或预测更加容易。

      image.gif

      DL之DNN优化技术:神经网络算法简介之GD/SGD算法的简介、代码实现、代码调参之详细攻略

      DL之DNN:BP类神经网络理解之不需要额外任何文字,只需要八张图讲清楚BP类神经网络的工作原理

      1、神经网络的基础知识

        • 神经元
        • 感知机
        • 激活函数:Sigmoid、tanh、ReLU、Leaky ReLU、ELU、Softmax。
        • 多层感知机:
        • 万能逼近定理:

        2、神经元的结构

        生物神经元包括细胞体和突起两个部分,突起又包括树突(接收信号)和轴突(传出信号)。

          • 轴突记录了神经元间联系的强弱。只有达到一定的兴奋程度,神经元才向外界传输信息。
          • 神经元之间的信号通过突触传递。

          image.gif

          3、感知机

          DL之Perceptron:Perceptron感知器(感知机/多层感知机/人工神经元)的简介、原理、案例应用(相关配图)之详细攻略

          4、万能逼近定理

           (Universal approximation theorem)

            • 只需一个包含单个隐藏层的前馈神经网络,即可逼近任意一个连续函数
            • 尽管仅有一个隐藏层的前馈网络足以表示任何函数,但是该隐藏层的神经元数目可能非常多,从而导致网络无法学习或正确泛化。

            5、神经网络训练

            (1)、损失函数:

            平均损失函数

            绝对值损失函数

            交叉熵损失函数:softmax回归,独热编码。

            (2)、优化目标

            (3)、梯度下降:

                • 梯度下降各种优化算法:Momentum、NAG、Adagrad、Adadelta、RMSprop、Adam

                (4)、反向传播法:计算图解释

                1、神经网络训练的优化目标

                image.gif

                6、神经网络学习

                (1)、通过调整神经元的参数,使得网络对给定输入可产生期望输出。

                image.gif

                (2)、学习层次化的表示(表征)

                    image.gif

                7、神经网络的前馈运算与反向传播

                前馈运算和反向传播:在训练网络过程中所使用的。如果经过训练模型,网络稳定下来以后,就可以把参数固定下来,此时就不再需要反向传播了,只需要前馈运算进行推理和预测即可!

                 

                image.gif

                8、激活函数

                DL学习—AF:理解机器学习中常用的激活函数(sigmoid、softmax等)简介、应用、计算图实现、代码实现详细攻略

                深度学习(神经网络)的算法分类

                        深度学习的形式包括多层感知器、卷积神经网络、循环神经网络、深度置信网络和其它混合构筑  。

                         前馈神经网络(NN),而是和循环神经网络(RNN)的概念是相对的。而反向传播方法可以用在FF网络中,此时,基于反向传播算法的前馈神经网络,被称为BP神经网络。

                1、常用的神经网络模型概览

                DL:神经网络所有模型(包括DNN、CNN、RNN等)的简介(概览)、网络结构简介、使用场景对比之详细攻略

                1、DNN

                DL之DNN:DNN深度神经网络算法的简介、相关论文、设计思路、关键步骤、实现代码等配图集合之详细攻略

                2、CNN

                DL之CNN:计算机视觉卷积神经网络算法CNN算法常见结构、发展、CNN优化技术、案例应用之详细攻略

                3、RNN

                DL之RNN:RNN算法的简介、相关论文、相关思路、关键步骤、配图集合+TF代码定义之详细攻略

                4、DBN

                深度学习(神经网络)的经典案例应用

                后期更新……


                相关文章
                |
                16天前
                |
                机器学习/深度学习 人工智能 算法
                【宠物识别系统】Python+卷积神经网络算法+深度学习+人工智能+TensorFlow+图像识别
                宠物识别系统,本系统使用Python作为主要开发语言,基于TensorFlow搭建卷积神经网络算法,并收集了37种常见的猫狗宠物种类数据集【'阿比西尼亚猫(Abyssinian)', '孟加拉猫(Bengal)', '暹罗猫(Birman)', '孟买猫(Bombay)', '英国短毛猫(British Shorthair)', '埃及猫(Egyptian Mau)', '缅因猫(Maine Coon)', '波斯猫(Persian)', '布偶猫(Ragdoll)', '俄罗斯蓝猫(Russian Blue)', '暹罗猫(Siamese)', '斯芬克斯猫(Sphynx)', '美国斗牛犬
                97 29
                【宠物识别系统】Python+卷积神经网络算法+深度学习+人工智能+TensorFlow+图像识别
                |
                15天前
                |
                机器学习/深度学习 人工智能 算法
                深入解析图神经网络:Graph Transformer的算法基础与工程实践
                Graph Transformer是一种结合了Transformer自注意力机制与图神经网络(GNNs)特点的神经网络模型,专为处理图结构数据而设计。它通过改进的数据表示方法、自注意力机制、拉普拉斯位置编码、消息传递与聚合机制等核心技术,实现了对图中节点间关系信息的高效处理及长程依赖关系的捕捉,显著提升了图相关任务的性能。本文详细解析了Graph Transformer的技术原理、实现细节及应用场景,并通过图书推荐系统的实例,展示了其在实际问题解决中的强大能力。
                103 30
                |
                22天前
                |
                机器学习/深度学习 算法 Serverless
                基于WOA-SVM的乳腺癌数据分类识别算法matlab仿真,对比BP神经网络和SVM
                本项目利用鲸鱼优化算法(WOA)优化支持向量机(SVM)参数,针对乳腺癌早期诊断问题,通过MATLAB 2022a实现。核心代码包括参数初始化、目标函数计算、位置更新等步骤,并附有详细中文注释及操作视频。实验结果显示,WOA-SVM在提高分类精度和泛化能力方面表现出色,为乳腺癌的早期诊断提供了有效的技术支持。
                |
                23天前
                |
                机器学习/深度学习 自然语言处理 数据可视化
                【由浅到深】从神经网络原理、Transformer模型演进、到代码工程实现
                阅读这个文章可能的收获:理解AI、看懂模型和代码、能够自己搭建模型用于实际任务。
                |
                25天前
                |
                机器学习/深度学习 自然语言处理 语音技术
                Python在深度学习领域的应用,重点讲解了神经网络的基础概念、基本结构、训练过程及优化技巧
                本文介绍了Python在深度学习领域的应用,重点讲解了神经网络的基础概念、基本结构、训练过程及优化技巧,并通过TensorFlow和PyTorch等库展示了实现神经网络的具体示例,涵盖图像识别、语音识别等多个应用场景。
                48 8
                |
                29天前
                |
                机器学习/深度学习 算法 关系型数据库
                基于PSO-SVM的乳腺癌数据分类识别算法matlab仿真,对比BP神经网络和SVM
                本项目展示了利用粒子群优化(PSO)算法优化支持向量机(SVM)参数的过程,提高了分类准确性和泛化能力。包括无水印的算法运行效果预览、Matlab2022a环境下的实现、核心代码及详细注释、操作视频,以及对PSO和SVM理论的概述。PSO-SVM结合了PSO的全局搜索能力和SVM的分类优势,特别适用于复杂数据集的分类任务,如乳腺癌诊断等。
                |
                1月前
                |
                机器学习/深度学习 自然语言处理 算法
                深入理解机器学习算法:从线性回归到神经网络
                深入理解机器学习算法:从线性回归到神经网络
                |
                1月前
                |
                机器学习/深度学习 人工智能 算法
                【车辆车型识别】Python+卷积神经网络算法+深度学习+人工智能+TensorFlow+算法模型
                车辆车型识别,使用Python作为主要编程语言,通过收集多种车辆车型图像数据集,然后基于TensorFlow搭建卷积网络算法模型,并对数据集进行训练,最后得到一个识别精度较高的模型文件。再基于Django搭建web网页端操作界面,实现用户上传一张车辆图片识别其类型。
                85 0
                【车辆车型识别】Python+卷积神经网络算法+深度学习+人工智能+TensorFlow+算法模型
                |
                2月前
                |
                机器学习/深度学习 人工智能 监控
                深入理解深度学习中的卷积神经网络(CNN):从原理到实践
                【10月更文挑战第14天】深入理解深度学习中的卷积神经网络(CNN):从原理到实践
                227 1
                |
                2月前
                |
                机器学习/深度学习 人工智能 算法
                【玉米病害识别】Python+卷积神经网络算法+人工智能+深度学习+计算机课设项目+TensorFlow+模型训练
                玉米病害识别系统,本系统使用Python作为主要开发语言,通过收集了8种常见的玉米叶部病害图片数据集('矮花叶病', '健康', '灰斑病一般', '灰斑病严重', '锈病一般', '锈病严重', '叶斑病一般', '叶斑病严重'),然后基于TensorFlow搭建卷积神经网络算法模型,通过对数据集进行多轮迭代训练,最后得到一个识别精度较高的模型文件。再使用Django搭建Web网页操作平台,实现用户上传一张玉米病害图片识别其名称。
                72 0
                【玉米病害识别】Python+卷积神经网络算法+人工智能+深度学习+计算机课设项目+TensorFlow+模型训练
                下一篇
                DataWorks