特征值和特征向量
特征值和特征向量是线性代数中十分关键的一部分内容。
概念
特征值和特征向量都是方阵的属性。描述的是方阵的特征,同时特征值和特征向量表征是当方阵做变换时候的一个特征。具体举例如下,
以一个向量在两个空间坐标系中的转换为例,给出空间基向量的矩阵,一个是标准基,另一个是
A
A
A,
对于一些向量,满足如下特点,
总结为一个向量经过坐标转换后对应的向量与其本身相比方向不变,是其某个倍数。这种向量
u
⃗
\vec{u}
u称为
A
A
A矩阵对应于
λ
\lambda
λ的特征向量,相应的倍数称为
A
A
A矩阵的特征值。
求解特征值和特征向量
对于
A
u
⃗
=
λ
u
⃗
A\vec{u} = λ\vec{u}
Au=λu而言,零向量在任何情况下是肯定满足的,即零向量是一个平凡解。所以,特征向量不考虑零向量。
但是,
λ
=
0
λ=0
λ=0并不平凡,当
λ
=
0
λ=0
λ=0时,
A
u
⃗
=
0
A\vec{u} = 0
Au=0是一个齐次线性方程组。回顾之前的知识,如果矩阵
A
A
A可逆,则
A
u
⃗
=
0
A\vec{u}=0
Au=0这个线性系统的
u
⃗
\vec{u}
u只有零解,但零向量不考虑在特征向量中,所以
u
⃗
\vec{u}
u不为零向量。故此时
A
A
A不可逆。所以特征值可以为0。
计算过程
方程有非零解对应的就是向量
u
⃗
\vec{u}
u不是零向量,回顾之前矩阵可逆的一系列等价命题,
因为此时
u
⃗
≠
0
\vec{u}≠0
u̸=0,所以方阵
A
A
A不可逆,对应着如上所有命题的逆命题,其中与计算相关的还有一个命题就是矩阵
A
A
A的行列式在
A
A
A不可逆时为0。所以求取特征值和特征向量就转化为一个求取行列式的问题,
d
e
t
(
A
−
λ
I
)
=
0
det(A-\lambda I)=0
det(A−λI)=0
这也就是行列式是求取特征值和特征向量的基础的原因。上面的方程中只有
λ
λ
λ一个未知数,对于所有的矩阵
A
A
A都是适用的,所以上面的方程也称为特征方程。
以上面笔记中的
A
A
A矩阵为例,
∣
A
−
λ
I
∣
=
∣
4
−
λ
−
2
1
1
−
λ
∣
=
(
4
−
λ
)
(
1
−
λ
)
−
(
−
2
)
=
λ
2
−
5
λ
+
6
=
(
λ
−
2
)
(
λ
−
3
)
=
0
|A-\lambda I|=\begin{vmatrix}4-\lambda&-2\\1&1-\lambda\end{vmatrix}\\=(4-\lambda)(1-\lambda)-(-2)\\=\lambda^2-5\lambda+6=(\lambda-2)(\lambda-3)=0
∣A−λI∣=∣∣∣∣4−λ1−21−λ∣∣∣∣=(4−λ)(1−λ)−(−2)=λ2−5λ+6=(λ−2)(λ−3)=0
可得,
λ
1
=
2
λ
2
=
3
\lambda_1=2\\\lambda_2=3
λ1=2λ2=3
对于每一个特征值求取特征向量,该过程就是一个求取线性系统解的过程,
对于一个特征值
λ
λ
λ而言,特征向量是不唯一的,有无数个。
基于上面的推导,也将矩阵可逆的等价命题补全,
相关概念
- 若
u
⃗
\vec{u}
A
A
λ
λ
k
u
⃗
k\vec{u}
k
≠
0
k≠0
对该结论进行证明,
A
(
k
u
⃗
)
=
k
(
A
u
⃗
)
=
k
(
λ
u
⃗
)
=
λ
(
k
u
⃗
)
A(k\vec{u})=k(A\vec{u})=k(\lambda \vec{u})=\lambda(k\vec{u})
-
(
A
−
λ
I
)
u
⃗
=
0
(A-λI)\vec{u}=0
A
−
λ
I
A-λI
E
λ
=
O
∪
λ
的
特
征
向
量
Eλ = {O}∪{λ的特征向量}
E
λ
Eλ
λ
λ
- 计算
λ
λ
d
e
t
(
A
−
λ
I
)
=
0
det(A-λI)=0
λ
λ
n
n
λ
λ
n
n
如果n
n
A
A
n
n
n
n
如果特征方程得到的n个特征值有相同的值存在的情况,此时的特征值称为多重特征值。
如果特征方程在实数范围内没有解,但是在复数范围内存在解,则称特征值为复数特征值。
特征值与特征向量的性质
特殊方阵的特征值和特征向量
- 对角矩阵
对角矩阵的特征值计算时根本无需求解矩阵的特征方程,对角线上的每个元素都是一个特征值。 - 上三角矩阵和下三角矩阵
上三角矩阵和下三角矩阵计算行列式的方式与对角矩阵相同,所以其特征值也和对角矩阵是一样的。
若λ是方阵A的特征值,则λm是Am的特征值
对这一问题的证明分为两种情况
-
m
≥
1
m≥1
-
m
=
−
1
m=-1
A
−
1
A^{-1}
A
A