备案控制台

开发者社区阿里云开发者学堂文章正文

误差反向传播算法-3|学习笔记

2022-11-22 79

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 快速学习误差反向传播算法-3

开发者学堂课程【神经网络概览及算法详解：误差反向传播算法-3】学习笔记与课程紧密联系，让用户快速学习知识

课程地址：https://developer.aliyun.com/learning/course/40/detail/931

误差反向传播算法-3

内容介绍：

一、损失函数优化：梯度下降法

二、 BP算法：梯度下降法

一、损失函数优化：梯度下降法

确定了损失函数，就需要对损失函数进行优化，求最小值，以平方损失函数(QuadraticLF)为例：L（y，f（x））=（y -f（x））²

求L的梯度：

假设激活函数选用了sigmoid函数

求出此时L的梯度;

//如果激活函数选用了sigmoid函数，sigmoid函数本身有一个特点，sigmoid函数本身乘以1减sigmoid的函数，形式非常优美。

二、 BP算法：梯度下降法

输入向量:X=(x₁，x₂…x_n)^T

隐层输出:Y=(y₁，y₂…y_m)^T

输出向量:O=(o₁，o₂…o_l)^T

期望输出:D=(d₁，d₂…d_l)^T

权重矩阵:V=(v₁,v₂…v_m)^T

W=(W_1,W₂…w_l)^T

//输入层到隐藏层的权重矩阵是v，隐藏层y到最终输入层o的权重矩阵是w，

向前传导的过程：

//向前传播的过程，从输入层到隐藏层，净输出是求和，隐藏层的实际输出yj=f（net_j）,j=1,2...,m作用到净输出上。

隐藏层到最终输出层，首先是净输出用w乘y，最终的输出oj=f（net_k），k=1,2...,I函数作用一下。

误差反向传导过程：

//E等于2分之1，d减o的平方，d是期望输出，o是实际输出，把它带进去。d是已知的，o可以用

oj=f（net_k），k=1,2...,I函数表示，net_k等于w乘y带入，y可以用yj=f（net_j）,j=1,2...,m表示，把y带进去，得到最终误差。

权重更新公式如下：

//对隐藏层到输出层的权重更新是，等于负η，η是学习率或者学习补偿或者更新补偿，E对w求偏导，E是误差，v等于E对v求偏导。

为了表示起来方便，记：

//net_k是输出层的代数和就是w乘y，激活函数没作用的净输出。

有：

//E首先对net_k求偏导，net_k在对w求偏导，做一个符号的代换。

//E首先对net_k求偏导等于E对o求偏导，o在对net_k求偏导，带进去，E等于（d-o）²，对o求偏导，求偏导以后成（d_k-o_k）。

//同样再去求，同样的道理，也是先E对y求偏导，在y对net_j 求偏导，y本身是net_j的函数，所以转换成。在求前面部分，因为是对y求偏导，刚才应该是ok可以表示成y的函数就等于

平方2乘上来和2分之1消掉，就是（d_k-o_k），在用这项对y乘偏导，在做一次连续求导，首先这个函数本身求导数，在对应里面求和的一项再对y求导就等于wk就可以了，，带进去就是

//更新权重的时候，直接算出Δw_kj和Δv_ji。Δw_kj中η是已知常量，d_k是已知期望数据，o_k是算出来的，y_i是已知的。Δv_ji也一样，多了个x_i，x_i也是已知的。O，y都是数据传播中算出来的，才得到误差，才可以算Δw。Δv也一样，像权重w，y等等在数据正向传播中都可以算出来的值，在反向传播中求Δv。用Δw和Δv更新权重。

文章标签：

机器学习/深度学习

算法

开发者

关键词：

反向传播算法

算法学习笔记

bqospzg5rfs7g

目录

相关文章

jerrywangsap

|

3天前

|

机器学习/深度学习算法网络架构

什么是神经网络学习中的反向传播算法？

什么是神经网络学习中的反向传播算法？

jerrywangsap

9 2 2

桃李春风一杯酒

|

3天前

|

机器学习/深度学习算法

大模型开发：解释反向传播算法是如何工作的。

反向传播算法是训练神经网络的常用方法，尤其适用于多层前馈网络。它包括前向传播、计算损失、反向传播和迭代过程。首先，输入数据通过网络层层传递至输出层，计算预测值。接着，比较实际输出与期望值，计算损失。然后，从输出层开始，利用链式法则反向计算误差和权重的梯度。通过梯度下降等优化算法更新权重和偏置，以降低损失。此过程反复进行，直到损失收敛或达到预设训练轮数，优化模型性能，实现对新数据的良好泛化。

桃李春风一杯酒

34 4 4

AlvinsFish

|

3天前

|

算法搜索推荐测试技术

python排序算法及优化学习笔记1

python实现的简单的排序算法，以及算法优化，学习笔记1

AlvinsFish

35 1 1

JOYCE_Leo16

|

3天前

|

机器学习/深度学习人工智能算法

神经网络算法——反向传播 Back Propagation

神经网络算法——反向传播 Back Propagation

JOYCE_Leo16

31 0 0

研发咨询顾问

|

3天前

|

机器学习/深度学习算法

反向传播原理的梯度下降算法

反向传播原理的梯度下降算法

研发咨询顾问

55 1 1

研发咨询顾问

|

3天前

|

机器学习/深度学习算法关系型数据库

反向传播原理的反向传播算法

反向传播原理的反向传播算法

研发咨询顾问

29 0 0

研发咨询顾问

|

3天前

|

机器学习/深度学习算法数据挖掘

反向传播算法

反向传播算法

研发咨询顾问

37 1 1

热烈的马

|

3天前

|

机器学习/深度学习数据采集算法

【深度学习基础】反向传播BP算法原理详解及实战演示（附源码）

【深度学习基础】反向传播BP算法原理详解及实战演示（附源码）

热烈的马

79 0 0

热烈的马

|

3天前

|

机器学习/深度学习算法 TensorFlow

【Python机器学习】神经网络中误差反向传播（BP）算法详解及代码示例（图文解释附源码）

【Python机器学习】神经网络中误差反向传播（BP）算法详解及代码示例（图文解释附源码）

热烈的马

50 0 0

热烈的马

|

3天前

|

机器学习/深度学习自然语言处理算法

【深度学习】常用算法生成对抗网络、自编码网络、多层感知机、反向传播等讲解（图文解释超详细）

【深度学习】常用算法生成对抗网络、自编码网络、多层感知机、反向传播等讲解（图文解释超详细）

热烈的马

48 0 0

阿里云开发者学堂

热门文章

最新文章

R语言聚类算法的应用实例

基于DCT和扩频的音频水印嵌入提取算法matlab仿真

R语言贝叶斯MCMC：GLM逻辑回归、Rstan线性回归、Metropolis Hastings与Gibbs采样算法实例

揭秘深度学习中的优化算法

椭圆曲线密码算法（ECC）：数学之美与安全之钥

圆堆图circle packing算法可视化分析电商平台网红零食销量采集数据

Python用机器学习算法进行因果推断与增量、增益模型Uplift Modeling智能营销模型

用N-S流程图表示算法

对称密钥加密算法和公开密钥加密算法有什么区别

分布式(计算机算法)

视觉智能平台常见问题之其他算法定制化开发如何解决

使用Python实现图像处理中的边缘检测算法

利用机器学习算法改善电商推荐系统的效率

Python基础算法解析：K最近邻算法

【数据结构与算法】—— 手撕红黑树

【优选算法】—— 字符串匹配算法

【优选算法】—— 滑动窗口类问题

【算法】——全排列算法讲解

【排序算法】数据结构排序详解

数据结构——排序算法之快速排序

相关课程

更多

相册服务中的故事生成算法介绍

Go语言核心编程 - 数据结构和算法

神经网络概览及算法详解

【算法实战】9. 线性回归算法

【算法实战】5. Logistic回归算法

【算法实战】2. K近邻算法

相关电子书

更多

数据+算法定义新世界

袋鼠云基于实时计算的反黄牛算法

Alink：基于Apache Flink的算法平台

相关实验场景

更多

如何快速训练大模型

TLS1.3的后量子算法集成

RSA非对称加密算法

推荐系统入门之使用ALS算法实现打分预测

下一篇

2024年阿里云免费云服务器及学生云服务器申请教程参考