一、回顾知识
假设:x xx表示标量;X XX表示m×n维的矩阵;求导的因变量用y yy表示标量;Y YY表示p × q p×qp×q维矩阵
二、用定义法求解标量对向量求导
小结:例2的较复杂的实值函数求导,最终排列出的求导结果较为复杂。
三、标量对向量求导
寻找较复杂的实值函数求导更方便的方法,不是每次都先针对任意一个分量,再进行排列。
标量对向量求导的基本法则(PS:和我们以前标量对标量求导的法则类似):
常量对向量的求导结果为0
线性法则:如果f ff、g gg都是实值函数,c 1 c1c1、c 2 c2c2为常数,则:
五、向量对向量求导
y = A x \mathbf{y} = \mathbf{A} \mathbf{x}y=Ax是向量。
A \mathbf{A}A为n×m矩阵
x \mathbf{x}x为m维向量;y \mathbf{y}y为n维向量
先分别求【矩阵的第 i ii 行和向量的内积】对向量的第 j jj 分量求导,定义法:
所以结果是矩阵A \mathbf{A}A的( i , j ) (i,j)(i,j)位置的值,排列组成的结果A \mathbf{A}A,而非A T \mathbf{A}^{T}A
T
。
六、定义法矩阵向量求导的缺点
定义法中间运算复杂,结果排列较为麻烦,如
对任意标量的求导容易,但是排列起来较为麻烦,所以进一步,我们可以使用矩阵微分和迹函数来进行矩阵向量求导。