100天搞定机器学习|day38 反向传播算法推导

简介: 100天搞定机器学习|day38 反向传播算法推导

上集我们学习了反向传播算法的原理,今天我们深入讲解其中的微积分理论,展示在机器学习中,怎么理解链式法则。


640.jpg


我们从一个最简单的网络讲起,每层只有一个神经元,图上这个网络就是由三个权重和三个偏置决定的,我们的目标是理解代价函数对这些变量有多敏感。这样我们就知道怎么调整这些变量,才能使代价函数下降的最快。


640.png


我们先来关注最后两个神经元,我们给最后一个神经元一个上标L,表示它处在第L层。给定一个训练样本,我们把这个最终层激活值要接近的目标叫做y,y的值为0/1。那么这个简易网络对于单个训练样本的代价就等于(a(L)−y)2。对于这个样本,我们把这个代价值标记为C0。


640.jpg


之前讲过,最终层的激活值公式:


640.png


换个标记方法:

640.png


整个流程就是这样的:

640.png


当然了,a(L−1)还可以再向上推一层,不过这不重要。

640.jpg


这些东西都是数字,我们可以想象,每个数字都对应数轴上的一个位置。我们第一个目标是来理解代价函数对权重的微小变化有多敏感。换句话说,求C0对的导数。的微小变化导致产生变化,然后导致,最终影响到cost。


640.jpg


我们把式子拆开,首先求的变化量比的变化量,即关于的导数;同力考虑变化量比的变化量,以及最终的c的变化量比上直接改动产生的变化量。


640.png


这就是链式法则


640.jpg


开始分别求导


640.png

640.png

这只是包含一个训练样本的代价对640.png的导数,

总的代价函数是所有训练样本代价的总平均,它对640.png的导数就要求出这个表达式对每一个训练样本的平均,


640.jpg


这只是梯度向量的一个分量,梯度由代价函数对每一个权重和偏置求导数构成。

640.png

当然了,对偏置求导数也是同样的步骤。只要把640.png替换成640.png

640.png


同样的,这里也有反向传播的思想

640.jpg


到此,我们可以方向应用链式法则,来计算代价函数对之前的权重和偏置的敏感程度

640.png


到这里,我们可以看每层不止一个神经元的情况了,其实并不复杂太多,只是多写一些下标罢了。

640.jpg


这些方程式和之前每层只有一个神经元的时候本质上一样的


640.jpg


代价函数也类似


640.png


不同的是代价函数对(L-1)层激活值的导数

因为此时,激活值可以通过不同的途径影响cost function,


640.jpg


只要计算出倒数第二层代价函数对激活值的敏感度,接下来重复上述过程就行了。至此,反向传播介绍完毕。


640.jpg

相关文章
|
3天前
|
机器学习/深度学习 算法 TensorFlow
机器学习算法简介:从线性回归到深度学习
【5月更文挑战第30天】本文概述了6种基本机器学习算法:线性回归、逻辑回归、决策树、支持向量机、随机森林和深度学习。通过Python示例代码展示了如何使用Scikit-learn、statsmodels、TensorFlow库进行实现。这些算法在不同场景下各有优势,如线性回归处理连续值,逻辑回归用于二分类,决策树适用于规则提取,支持向量机最大化类别间隔,随机森林集成多个决策树提升性能,而深度学习利用神经网络解决复杂模式识别问题。理解并选择合适算法对提升模型效果至关重要。
16 4
|
2天前
|
机器学习/深度学习 数据采集 存储
【机器学习】K-近邻算法(KNN)全面解析
K-近邻算法(K-Nearest Neighbors, KNN)是一种基于实例的学习方法,属于监督学习范畴。它的工作原理简单直观:给定一个训练数据集,对新的输入实例,KNN算法通过计算其与训练集中每个实例的距离,找出距离最近的K个邻居,然后根据这些邻居的类别(对于分类任务)或值(对于回归任务)来预测新实例的类别或值。KNN因其简单高效和无需训练过程的特点,在众多领域中得到广泛应用,如模式识别、推荐系统、图像分类等。
5 0
|
2天前
|
机器学习/深度学习 算法
探索机器学习中的支持向量机(SVM)算法
【5月更文挑战第31天】 在数据科学的广阔天地中,支持向量机(SVM)以其卓越的性能和强大的理论基础脱颖而出。本文将深入剖析SVM的工作原理、核心概念以及实际应用,旨在为读者提供一个清晰的理解视角,并通过实例演示其在分类问题中的有效性。我们将从线性可分的情况出发,逐步过渡到非线性问题的处理方法,并探讨如何通过调整参数来优化模型的性能。
|
3天前
|
机器学习/深度学习 Web App开发 算法
Python 机器学习算法交易实用指南(一)(5)
Python 机器学习算法交易实用指南(一)
11 2
|
3天前
|
传感器 机器学习/深度学习 存储
Python 机器学习算法交易实用指南(一)(4)
Python 机器学习算法交易实用指南(一)
13 4
|
3天前
|
机器学习/深度学习 算法 API
Python 机器学习算法交易实用指南(一)(3)
Python 机器学习算法交易实用指南(一)
14 4
|
3天前
|
机器学习/深度学习 存储 算法
Python 机器学习算法交易实用指南(一)(2)
Python 机器学习算法交易实用指南(一)
9 2
|
3天前
|
机器学习/深度学习 算法 数据挖掘
Python 机器学习算法交易实用指南(一)(1)
Python 机器学习算法交易实用指南(一)
12 4
|
3天前
|
机器学习/深度学习 存储 分布式计算
Python 机器学习算法交易实用指南(五)(5)
Python 机器学习算法交易实用指南(五)
11 2
|
3天前
|
机器学习/深度学习 数据采集 算法
Python 机器学习算法交易实用指南(五)(4)
Python 机器学习算法交易实用指南(五)
15 4