备案控制台

开发者社区人工智能文章正文

一文彻底搞懂BP算法：原理推导+数据演示+项目实战（上篇）

2018-04-02 3868

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 欢迎大家关注我们的网站和系列教程：http://www.tensorflownews.com/，学习更多的机器学习、深度学习的知识！反向传播算法（Backpropagation Algorithm，简称BP算法）是深度学习的重要思想基础，对于初学者来说也是必须要掌握的基础知识！本文希望以一个清晰的脉络和详细的说明，来让读者彻底明白BP算法的原理和计算过程。

欢迎大家关注我们的网站和系列教程：http://www.tensorflownews.com/，学习更多的机器学习、深度学习的知识！

反向传播算法（Backpropagation Algorithm，简称BP算法）是深度学习的重要思想基础，对于初学者来说也是必须要掌握的基础知识！本文希望以一个清晰的脉络和详细的说明，来让读者彻底明白BP算法的原理和计算过程。

全文分为上下两篇，上篇主要介绍BP算法的原理（即公式的推导），介绍完原理之后，我们会将一些具体的数据带入一个简单的三层神经网络中，去完整的体验一遍BP算法的计算过程；下篇是一个项目实战，我们将带着读者一起亲手实现一个BP神经网络（不适用任何第三方的深度学习框架）来解决一个具体的问题。

读者在学习的过程中，有任何的疑问，欢迎加入我们的交流群（扫描文章最后的二维码即可加入），和大家一起讨论！

1.BP算法的推导

图1 一个简单的三层神经网络
图1所示是一个简单的三层（两个隐藏层，一个输出层）神经网络结构，假设我们使用这个神经网络来解决二分类问题，我们给这个网络一个输入样本，通过前向运算得到输出。输出值的值域为，例如的值越接近0，代表该样本是“0”类的可能性越大，反之是“1”类的可能性大。

1.1前向传播的计算

为了便于理解后续的内容，我们需要先搞清楚前向传播的计算过程，以图1所示的内容为例：

输入的样本为：

第一层网络的参数为：

第二层网络的参数为：

第三层网络的参数为：

1.1.1第一层隐藏层的计算

图2 计算第一层隐藏层

1.1.2第二层隐藏层的计算

图3 计算第二层隐藏层

1.1.3输出层的计算

图4 计算输出层

即：

单纯的公式推导看起来有些枯燥，下面我们将实际的数据带入图1所示的神经网络中，完整的计算一遍。

2.图解BP算法

图5 图解BP算法
我们依然使用如图5所示的简单的神经网络，其中所有参数的初始值如下：

输入的样本为（假设其真实类标为“1”）：

第一层网络的参数为：

第二层网络的参数为：

第三层网络的参数为：

2.1前向传播

我们首先初始化神经网络的参数，计算第一层神经元：

2.2误差反向传播

接着计算第二层隐藏层的误差项，根据误差项的计算公式有：

最后是计算第一层隐藏层的误差项：

2.3更新参数

上一小节中我们已经计算出了每一层的误差项，现在我们要利用每一层的误差项和梯度来更新每一层的参数，权重W和偏置b的更新公式如下：

通常权重W的更新会加上一个正则化项来避免过拟合，这里为了简化计算，我们省去了正则化项。上式中的是学习率，我们设其值为0.1。参数更新的计算相对简单，每一层的计算方式都相同，因此本文仅演示第一层隐藏层的参数更新：

3.小结

至此，我们已经完整介绍了BP算法的原理，并使用具体的数值做了计算。在下篇中，我们将带着读者一起亲手实现一个BP神经网络（不适用任何第三方的深度学习框架），敬请期待！有任何疑问，欢迎加入我们一起交流！

本篇文章出自http://www.tensorflownews.com，对深度学习感兴趣，热爱Tensorflow的小伙伴，欢迎关注我们的网站！

文章标签：

机器学习/深度学习

算法

算法框架/工具

TensorFlow

关键词：

bp算法

算法原理

算法bp

算法数据

算法推导

磐石001

目录

相关文章

软件算法开发

|

9天前

|

机器学习/深度学习算法

基于改进遗传优化的BP神经网络金融序列预测算法matlab仿真

本项目基于改进遗传优化的BP神经网络进行金融序列预测，使用MATLAB2022A实现。通过对比BP神经网络、遗传优化BP神经网络及改进遗传优化BP神经网络，展示了三者的误差和预测曲线差异。核心程序结合遗传算法（GA）与BP神经网络，利用GA优化BP网络的初始权重和阈值，提高预测精度。GA通过选择、交叉、变异操作迭代优化，防止局部收敛，增强模型对金融市场复杂性和不确定性的适应能力。

软件算法开发

139 80 80

2G冲浪词条

|

8天前

|

算法 Java 数据库

理解CAS算法原理

CAS（Compare and Swap，比较并交换）是一种无锁算法，用于实现多线程环境下的原子操作。它通过比较内存中的值与预期值是否相同来决定是否进行更新。JDK 5引入了基于CAS的乐观锁机制，替代了传统的synchronized独占锁，提升了并发性能。然而，CAS存在ABA问题、循环时间长开销大和只能保证单个共享变量原子性等缺点。为解决这些问题，可以使用版本号机制、合并多个变量或引入pause指令优化CPU执行效率。CAS广泛应用于JDK的原子类中，如AtomicInteger.incrementAndGet()，利用底层Unsafe库实现高效的无锁自增操作。

2G冲浪词条

30 0 1

软件算法开发

|

2天前

|

机器学习/深度学习算法

基于遗传优化的双BP神经网络金融序列预测算法matlab仿真

本项目基于遗传优化的双BP神经网络实现金融序列预测，使用MATLAB2022A进行仿真。算法通过两个初始学习率不同的BP神经网络（e1, e2）协同工作，结合遗传算法优化，提高预测精度。实验展示了三个算法的误差对比结果，验证了该方法的有效性。

软件算法开发

21 10 10

简简单单做算法

|

2月前

|

机器学习/深度学习算法 Serverless

基于WOA-SVM的乳腺癌数据分类识别算法matlab仿真,对比BP神经网络和SVM

本项目利用鲸鱼优化算法（WOA）优化支持向量机（SVM）参数，针对乳腺癌早期诊断问题，通过MATLAB 2022a实现。核心代码包括参数初始化、目标函数计算、位置更新等步骤，并附有详细中文注释及操作视频。实验结果显示，WOA-SVM在提高分类精度和泛化能力方面表现出色，为乳腺癌的早期诊断提供了有效的技术支持。

简简单单做算法

81 26 26

ZOMI酱

|

29天前

|

存储人工智能缓存

【AI系统】布局转换原理与算法

数据布局转换技术通过优化内存中数据的排布，提升程序执行效率，特别是对于缓存性能的影响显著。本文介绍了数据在内存中的排布方式，包括内存对齐、大小端存储等概念，并详细探讨了张量数据在内存中的排布，如行优先与列优先排布，以及在深度学习中常见的NCHW与NHWC两种数据布局方式。这些布局方式的选择直接影响到程序的性能，尤其是在GPU和CPU上的表现。此外，还讨论了连续与非连续张量的概念及其对性能的影响。

ZOMI酱

48 3 3

代码bug生产队

|

2月前

|

机器学习/深度学习人工智能算法

探索人工智能中的强化学习：原理、算法与应用

探索人工智能中的强化学习：原理、算法与应用

代码bug生产队

64 3 3

简简单单做算法

|

2月前

|

机器学习/深度学习算法关系型数据库

基于PSO-SVM的乳腺癌数据分类识别算法matlab仿真,对比BP神经网络和SVM

本项目展示了利用粒子群优化（PSO）算法优化支持向量机（SVM）参数的过程，提高了分类准确性和泛化能力。包括无水印的算法运行效果预览、Matlab2022a环境下的实现、核心代码及详细注释、操作视频，以及对PSO和SVM理论的概述。PSO-SVM结合了PSO的全局搜索能力和SVM的分类优势，特别适用于复杂数据集的分类任务，如乳腺癌诊断等。

简简单单做算法

42 4 4

有路有乔-六月

|

2月前

|

机器学习/深度学习人工智能算法

探索人工智能中的强化学习：原理、算法及应用

探索人工智能中的强化学习：原理、算法及应用

有路有乔-六月

67 0 0

简简单单做算法

|

5天前

|

机器学习/深度学习数据采集算法

基于PSO粒子群优化的CNN-GRU-SAM网络时间序列回归预测算法matlab仿真

本项目展示了基于PSO优化的CNN-GRU-SAM网络在时间序列预测中的应用。算法通过卷积层、GRU层、自注意力机制层提取特征，结合粒子群优化提升预测准确性。完整程序运行效果无水印，提供Matlab2022a版本代码，含详细中文注释和操作视频。适用于金融市场、气象预报等领域，有效处理非线性数据，提高预测稳定性和效率。

简简单单做算法

36 11 11

软件算法开发

|

1天前

|

算法

基于梯度流的扩散映射卡尔曼滤波算法的信号预处理matlab仿真

本项目基于梯度流的扩散映射卡尔曼滤波算法（GFDMKF），用于信号预处理的MATLAB仿真。通过设置不同噪声大小，测试滤波效果。核心代码实现数据加载、含噪信号生成、扩散映射构建及DMK滤波器应用，并展示含噪与无噪信号及滤波结果的对比图。GFDMKF结合非线性流形学习与经典卡尔曼滤波，提高对非线性高维信号的滤波和跟踪性能。 **主要步骤：** 1. 加载数据并生成含噪测量值。 2. 使用扩散映射捕捉低维流形结构。 3. 应用DMK滤波器进行状态估计。 4. 绘制不同SNR下的轨迹示例。

软件算法开发

21 6 6

热门文章

最新文章

深入解析PID控制算法：从理论到实践的完整指南

猫狗宠物识别系统Python+TensorFlow+人工智能+深度学习+卷积网络算法

利用Python内置函数实现的冒泡排序算法

用 Python 实现快速排序算法。

深入解析图神经网络：Graph Transformer的算法基础与工程实践

【宠物识别系统】Python+卷积神经网络算法+深度学习+人工智能+TensorFlow+图像识别

马特赛特旋转算法：Python的随机模块背后的力量

基于改进遗传优化的BP神经网络金融序列预测算法matlab仿真

K-means聚类算法是机器学习中常用的一种聚类方法，通过将数据集划分为K个簇来简化数据结构

基于GA遗传算法的PID控制器参数优化matlab建模与仿真

【Paddle】PCA线性代数基础 + 领域应用：人脸识别算法（1.1w字超详细：附公式、代码）

BASE64的算法说明

算法人生（1）：从“强化学习”看如何“战胜拖延”

理解并应用机器学习算法：决策树

【机器学习】在使用K-means聚类算法时，如何选择K的值？

【机器学习】为什么K-means算法使用欧式距离度量？

【机器学习】描述K-means算法的步骤

【机器学习】K-means和KNN算法有什么区别？

C语言易混淆、简单算法、结构体题目练习、常见关键字总结-2

C语言易混淆、简单算法、结构体题目练习、常见关键字总结-1

相关课程

更多

智能运维赛（复赛）：利用数据和算法，快速定位系统异常并进行根因分析

智能创作赛（复赛）：相册应用中的视频故事生成算法介绍

智能创作赛（初赛）：相册应用中的故事生成算法介绍

相册服务中的故事生成算法介绍

Go语言核心编程 - 数据结构和算法

神经网络概览及算法详解

相关电子书

更多

数据+算法定义新世界

袋鼠云基于实时计算的反黄牛算法

Alink：基于Apache Flink的算法平台

相关实验场景

更多

使用Swing算法实现商品推荐

RSA密码算法设计与实现

RSA非对称加密算法

欧拉图的构造性证明与算法实现

实验手册指导文档

推荐系统入门之使用ALS算法实现打分预测

下一篇

阿里云无影云电脑免费试用，最长可试用3个月