备案控制台

开发者社区人工智能文章正文

深度学习入门（7）误差反向传播计算方式及简单计算层的实现

2022-12-08 182

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 深度学习入门（7）误差反向传播计算方式及简单计算层的实现

1 误差的反向传播

1.1加法节点的反向传播

1.2乘法节点的反向传播

这里我们考虑z = xy。这个式子的导数用下式表示。

乘法的反向传播会将上游的值乘以正向传播时的输入信号的“翻转值”后传递给下游。翻转值表示一种翻转关系，如图5-12所示，正向传播时信号是x的话，反向传播时则是y；正向传播时信号是y的话，反向传播时则是x。

1.3 苹果的例子

再来思考一下本章最开始举的购买苹果的例子（ 2个苹果和消费税）。这里要解的问题是苹果的价格、苹果的个数、消费税这3个变量各自如何影响最终支付的金额。这个问题相当于求“支付金额关于苹果的价格的导数”“支付金额关于苹果的个数的导数”“支付金额关于消费税的导数”。用计算图的反向传播来解的话，求解过程如图所示。

练习：

在图中的方块中填入数字，求各个变量的导数？

答案：

2 简单层的实现

我们把要实现的计算图的乘法节点称为“乘法层”（MulLayer），加法节点称为“加法层” AddLayer）。

2.1乘法层的实现

层的实现中有两个共通的方法（接口）forward()和backward()。 forward()对应正向传播， backward()对应反向传播。

注：backward()将从上游传来的导数（ dout）乘以正向传播的翻转值，然后传给下游。

dout表示从上游传过来的导数。

举例：

现在我们使用 MulLayer实现前面的购买苹果的例子（ 2个苹果和消费税）

此外，关于各个变量的导数可由 backward()求出。

这里，调用 backward()的顺序与调用 forward()的顺序相反。此外，要注意 backward()的参数中需要输入“关于正向传播时的输出变量的导数”。比如，mul_apple_layer乘法层在正向传播时会输出 apple_price，在反向传播时，则会将 apple_price的导数 dapple_price设为参数。

2.2加法层的实现

backward()将上游传来的导数（ dout）原封不动地传递给下游。

举例：

购买2个苹果和3个橘子的例子。

2.3总结

计算的大致步骤：

1，生成必要的层，

2，以合适的顺序调用正向传播的forward()方法。

3，用与正向传播相反的顺序调用反向传播的backward()方法，就可以求出想要的导数。

如果内容对你有帮助，感谢点赞+关注哦！

文章标签：

机器学习/深度学习

关键词：

深度学习入门

深度学习计算

深度学习入门反向传播

深度学习反向传播

深度学习误差

阿旭算法与机器学习

目录

相关文章

阿旭算法与机器学习

|

机器学习/深度学习

深度学习入门（9）神经网络Affine与Softmax层的计算图表示方式及其误差反向传播的代码实现

深度学习入门（9）神经网络Affine与Softmax层的计算图表示方式及其误差反向传播的代码实现

阿旭算法与机器学习

431 0 0

深度学习入门（9）神经网络Affine与Softmax层的计算图表示方式及其误差反向传播的代码实现

游客oetevljcjdk52

|

机器学习/深度学习算法

十一、神经网络的成本函数和误差反向传播算法

十一、神经网络的成本函数和误差反向传播算法

游客oetevljcjdk52

266 0 0

十一、神经网络的成本函数和误差反向传播算法

AiCharm

|

机器学习/深度学习算法

深度学习相关概念：计算图与反向传播

在深度学习分类问题中，反向传播是一个重要的环节，它决定着模型是否能被训练，反向传播相当于一个负反馈，当一件事做完之后，会寻找当前事件做的不好的问题，进行回传，当下次在做的时候，进行优化。

AiCharm

231 0 0

阿旭算法与机器学习

|

机器学习/深度学习算法 Python

深度学习入门（3）神经网络参数梯度的计算方式

深度学习入门（3）神经网络参数梯度的计算方式

阿旭算法与机器学习

897 0 0

深度学习入门（3）神经网络参数梯度的计算方式

东方睿赢

|

8月前

|

机器学习/深度学习决策智能

**批量归一化(BN)**是2015年提出的深度学习优化技术，旨在解决**内部协变量偏移**和**梯度问题**。

【6月更文挑战第28天】**批量归一化(BN)**是2015年提出的深度学习优化技术，旨在解决**内部协变量偏移**和**梯度问题**。BN通过在每个小批量上执行**标准化**，然后应用学习到的γ和β参数，确保层间输入稳定性，加速训练，减少对超参数的敏感性，并作为隐含的正则化手段对抗过拟合。这提升了模型训练速度和性能，简化了初始化。

东方睿赢

79 0 0

阿旭算法与机器学习

|

机器学习/深度学习图计算

深度学习入门（6）误差反向传播基础---计算图与链式法则

深度学习入门（6）误差反向传播基础---计算图与链式法则

阿旭算法与机器学习

367 0 0

深度学习入门（6）误差反向传播基础---计算图与链式法则

-开发达人-

|

机器学习/深度学习传感器编解码

物理系统执行机器学习计算，一种使用反向传播训练的深度物理神经网络

物理系统执行机器学习计算，一种使用反向传播训练的深度物理神经网络

-开发达人-

224 0 0

Deephub

|

2月前

|

机器学习/深度学习数据采集人工智能

基于Huffman树的层次化Softmax：面向大规模神经网络的高效概率计算方法

层次化Softmax算法通过引入Huffman树结构，将传统Softmax的计算复杂度从线性降至对数级别，显著提升了大规模词汇表的训练效率。该算法不仅优化了计算效率，还在处理大规模离散分布问题上提供了新的思路。文章详细介绍了Huffman树的构建、节点编码、概率计算及基于Gensim的实现方法，并讨论了工程实现中的优化策略与应用实践。

Deephub

84 15 15

基于Huffman树的层次化Softmax：面向大规模神经网络的高效概率计算方法

汀丶人工智能

|

机器学习/深度学习资源调度自然语言处理

深度学习基础入门篇[七]：常用归一化算法、层次归一化算法、归一化和标准化区别于联系、应用案例场景分析。

深度学习基础入门篇[七]：常用归一化算法、层次归一化算法、归一化和标准化区别于联系、应用案例场景分析。

汀丶人工智能

734 0 0

c清风莫追

|

机器学习/深度学习

【深度学习】5-从计算图直观认识“激活函数不以零为中心导致收敛变慢”

【深度学习】5-从计算图直观认识“激活函数不以零为中心导致收敛变慢”

c清风莫追

242 0 0

【深度学习】5-从计算图直观认识“激活函数不以零为中心导致收敛变慢”

热门文章

最新文章

deepseek部署的详细步骤和方法，基于Ollama获取顶级推理能力！

讨论阶段性给予客户交付物所引发的风险问题

Linus Torvalds将中国亮相LinuxCon + ContainerCon + CloudOpen

DispatcherServlet与初始化主线

网络安全研究人员发现新漏洞：或成另一个WannaCry

Swift中常量和变量的声明

[20160516]adrci purge.txt

Docker Secure Deployment Guidelines

Eclipse没有权限操作rt.jar包中的sun包，导致sun.net.ftp.FtpClient引用报错

Learning Cocos2d-x for WP8（9）——Sprite到哪，我做主

去中心化存储：数据存储的新范式

AI 赋能混合云运维：告别手工操作，迈向智能自愈！

从Excel到大数据：别让工具限制你的思维！

Go 切片导致 rand.Shuffle 产生重复数据的原因与解决方案

基于SVPWM矢量控制的无速度传感器电机控制系统simulink建模与仿真

基于小波变换和峰值搜索的光谱检测matlab仿真,带GUI界面

DragAnything：视频PS来了！开源AI控制器让视频「指哪动哪」：拖拽任意物体轨迹，多对象独立运动一键生成

FoloUp：比HR更懂岗位需求！开源语音面试平台爆火：1份岗位需求生成100问，语音AI追问逻辑漏洞

KTransformers：告别天价显卡！国产框架让单卡24G显存跑DeepSeek-R1 671B大模型：推理速度飙升28倍

基于深度学习的路面裂缝检测算法matlab仿真

相关课程

更多

深度学习与自动驾驶

高校精品课-复旦大学-机器学习与深度学习

神经网络概览及算法详解

机器学习基础与回归算法

场景实践 - 基于阿里云PAI机器学习平台使用时间序列分解模型预测商品销量

神经网络与深度学习

相关电子书

更多

深度学习论文实现：空间变换网络-第一部分

阿里云千亿特征深度学习算法XNN实践

阿里千亿特征深度学习算法XNN实践

相关实验场景

更多

欧拉图的构造性证明与算法实现

推荐系统入门之使用ALS算法实现打分预测

下一篇

阿里云oss简介和如何对接使用