本篇特征值、特征向量笔记来源于MIT线性代数课程。
矩阵特征值与特征向量
✨引言
对于方阵而言,现在要找一些特殊的数字,即特征值,和特殊的向量,即特征向量。
✨什么是特征向量呢?
给定矩阵A,矩阵A作用在向量上,得到向量Ax(A的作用,作用在一个向量上,这其实就类似于函数,输入向量x,得到向量Ax)
在这些向量中,我们感兴趣的是一些特殊的向量,即变换前后方向一致的向量。
对于大多数向量而言,变换后的Ax是对于x是不同方向的,但是有特定的向量能使Ax平行于x。这些特殊的向量就是特征向量。
✨表示
Ax=λx
其中,λ为一系数。可以与原来向量x的方向相同,也可以相反,即λ可以为正,可以为负,也可以为0。(λ也甚至可以是复数)
在上述方程中,
x就是特征向量,λ就是特征值。
✨从特例看特征值与特征向量
1️⃣投影矩阵
给定一个平面M,投影矩阵P作用于三维空间中所有的向量,那么哪些是P的特征向量呢?
一,在平面M上的任意向量,经过投影矩阵的作用,这些向量的长度和方向不变,
Px=x
即特征值为1。
二,任意垂直于平面M的向量,经过投影矩阵的作用,这些向量的方向不变,长度变为0,
Px=0
即特征值为0。
2️⃣矩阵A,交换向量的两个元素
特征值为1的特征向量
特征值为-1的特征向量
✨你发现了吗?
属于两个不同特征值的特征向量是垂直的!
✨引入:特征值的性质
n阶矩阵有n个特征值,在找这些特征值的时候,这里有一个特别的性质:
特征值之和等于矩阵元素对角线元素之和。(矩阵对角线元素之和也成为迹)
在上述这个2阶矩阵中,若已知一个特征值为1,矩阵对角线元素之和为0,则可以知道另一个特征值为-1。
✨如何求解方程
首先,我们先将此移向:
λ未知,x未知,但是对于不为0向量的x来说,这个式子说明了一点
一个矩阵,即A−λI作用于一个不为零的向量x后向量变成了0,那么这个矩阵是奇异矩阵
奇异矩阵的性质:
奇异矩阵的行列式为0
非奇异矩阵(等价):
1.行列式不为0
2.矩阵是满秩的
3.矩阵是可逆的
由此,上述这个式子中就不含x了,从而得到一个关于
λ
的一个方程,该方程叫做特征方程或者特征值方程。
▶️ 思路:
▶️对零空间的理解:
首先,零空间并不是维度为0.
零空间不会独立存在的,它依赖于某个特定的矩阵A而存在。
(拿上面来说,我们就是在寻找矩阵A的零空间,即在矩阵A的作用下被映射到零点的所有向量的集合)
求 解 λ 求解\lambda
求解λ
✨对称矩阵例子:
对于对称矩阵A
下面我们来求解它的特征值。
因此我们可以得到矩阵A的两个特征值2和4。
接下来我们来求特征向量:
根据( A − λ I ) x = 0 (\Alpha -\lambda I)x=0(A−λI)x=0,我们已知λ \lambdaλ,即已知( A − λ I ) (\Alpha -\lambda I)(A−λI)这个矩阵,它是一个奇异矩阵,作用于x xx 使之为零向量,则x xx是相应零空间中的向量。
▶️首先,我们先来求解特征值是4对应的特征向量
▶️接下来,我们先来求解特征值是2对应的特征向量
✨对比观察两个矩阵及它们的特征值及特征向量:
A 1 和 A 2 特 征 向 量 相 同 A_1和A_2特征向量相同A
特征向量相同
且它们特征值的关系为:
这值得我们细细研究:
如果有:
则
由此,我们可以得出,
特征向量x xx是两个矩阵共同的特征向量
由(2),可得,A + 3 I A+3IA+3I的特征值为λ + 3 \lambda+3λ+3
由此,我们可以得出,若矩阵A 和 B A和BA和B存在A = B + 3 λ A=B+3\lambdaA=B+3λ
✨旋转矩阵例子 =>复数特征值:
根据上面我们得到的结论,矩阵的两个特征值λ 1 和 λ 2 ,特征值之和等于矩阵的迹(即矩阵的对角线元素之和),特征值之积等于矩阵行列式的值,即
在复数域,我们解出:
研究它的意义在于,我们由原来的一个实矩阵,扩展至它的特征值为一对复数。
而出现复数的原因,我们可以直观理解为与矩阵的对称性有关。
相比于前面的举例提到的,如果矩阵是对称的,就不会有复数特征值。
如果我们规定矩阵是对称的或者接近对称的,那么特征值就是实数。
如果越不对称,就如上述的旋转矩阵Q,这种矩阵特征值为纯虚数。
这两种是极端情况。
那么其余的就是介于对称和反对称的矩阵,即部分对称,部分反对称。
举个例子:
对于这个矩阵,它的两个特征值:
从而,我们解出,
当然,如果你直接观察出这是一个三角矩阵并了解它的性质,可以直接从矩阵得出它的特征值。
三角矩阵的特征值即为对角线的元素,从而,