【机器学习中的矩阵求导】(二)矩阵向量求导(定义法)

简介: 假设:x xx表示标量;X XX表示m×n维的矩阵;求导的因变量用y yy表示标量;Y YY表示p × q p×qp×q维矩阵

一、回顾知识

假设:x xx表示标量;X XX表示m×n维的矩阵;求导的因变量用y yy表示标量;Y YY表示p × q p×qp×q维矩阵

image.png

二、用定义法求解标量对向量求导

image.png

image.png

小结:例2的较复杂的实值函数求导,最终排列出的求导结果较为复杂。

三、标量对向量求导

寻找较复杂的实值函数求导更方便的方法,不是每次都先针对任意一个分量,再进行排列。

标量对向量求导的基本法则(PS:和我们以前标量对标量求导的法则类似):

常量对向量的求导结果为0

线性法则:如果f ff、g gg都是实值函数,c 1 c1c1、c 2 c2c2为常数,则:


image.png

image.pngimage.png

五、向量对向量求导

y = A x \mathbf{y} = \mathbf{A} \mathbf{x}y=Ax是向量。

A \mathbf{A}A为n×m矩阵

x \mathbf{x}x为m维向量;y \mathbf{y}y为n维向量

先分别求【矩阵的第 i ii 行和向量的内积】对向量的第 j jj 分量求导,定义法:

image.png

所以结果是矩阵A \mathbf{A}A的( i , j ) (i,j)(i,j)位置的值,排列组成的结果A \mathbf{A}A,而非A T \mathbf{A}^{T}A

T

六、定义法矩阵向量求导的缺点

定义法中间运算复杂,结果排列较为麻烦,如

image.png

对任意标量的求导容易,但是排列起来较为麻烦,所以进一步,我们可以使用矩阵微分和迹函数来进行矩阵向量求导。

相关文章
|
7月前
|
机器学习/深度学习 人工智能 TensorFlow
人工智能平台PAI产品使用合集之ev必须在特定的scope下定义吗
阿里云人工智能平台PAI是一个功能强大、易于使用的AI开发平台,旨在降低AI开发门槛,加速创新,助力企业和开发者高效构建、部署和管理人工智能应用。其中包含了一系列相互协同的产品与服务,共同构成一个完整的人工智能开发与应用生态系统。以下是对PAI产品使用合集的概述,涵盖数据处理、模型开发、训练加速、模型部署及管理等多个环节。
|
7月前
|
机器学习/深度学习 传感器 算法
机器学习基础入门(一)(机器学习定义及分类)
机器学习基础入门(一)(机器学习定义及分类)
|
7月前
|
机器学习/深度学习 JavaScript Python
GEE机器学习——混淆矩阵Classifier.confusionMatrix()和errorMatrix()和exlain()的用法(js和python代码)
GEE机器学习——混淆矩阵Classifier.confusionMatrix()和errorMatrix()和exlain()的用法(js和python代码)
194 0
|
7月前
|
机器学习/深度学习 人工智能 算法
【人工智能】<吴恩达-机器学习>批量梯度下降&矩阵和向量运算概述
【1月更文挑战第26天】【人工智能】<吴恩达-机器学习>批量梯度下降&矩阵和向量运算概述
|
机器学习/深度学习 监控 PyTorch
机器学习 - 混淆矩阵:技术与实战全方位解析
机器学习 - 混淆矩阵:技术与实战全方位解析
561 0
|
机器学习/深度学习
【吴恩达机器学习笔记】三、矩阵
【吴恩达机器学习笔记】三、矩阵
86 0
|
机器学习/深度学习 算法
【机器学习】分类模型评价指标(混淆矩阵、ROC)(已修改,放心看)
【机器学习】分类模型评价指标(混淆矩阵、ROC)(已修改,放心看)
200 0
|
机器学习/深度学习 Python
【机器学习】混淆矩阵的原理(理论+图解)
【机器学习】混淆矩阵的原理(理论+图解)
351 0
【机器学习】混淆矩阵的原理(理论+图解)
|
机器学习/深度学习
机器学习中矩阵求导法则
矩阵求导的本质上就是矩阵中元素对元素的求导,只是将其按照矩阵的形式进行一些规范化的写法罢了
131 0
|
机器学习/深度学习 数据采集 人工智能
ML:MLOps系列讲解之《MLOps的定义与发展—你为什么可能想使用机器学习》解读
ML:MLOps系列讲解之《MLOps的定义与发展—你为什么可能想使用机器学习》解读
ML:MLOps系列讲解之《MLOps的定义与发展—你为什么可能想使用机器学习》解读