矩阵分解指的是将复杂的矩阵分解成比较简单的矩阵的乘积的形式。在数值代数、矩阵论和最优化应用。

三角分解:

矩阵的三角分解:将一个方阵

A

\pmb{A}

AA分解成一个下三角阵

L

\pmb{L}

LL和一个上三角矩阵

R

\pmb{R}

RR的乘积,即

A

=

L

R

\pmb{A}=\pmb{L}\pmb{R}

AA=LLRR

充分必要条件:

A

\pmb{A}

AA的各阶顺序主子阵可逆。

分解的方法:只需要对矩阵

(

A

,

E

)

(\pmb{A},\pmb{E})

(AA,EE)初等变换成上下三角的形式,就可以得到上三角和下三角矩阵。

满秩分解:

满秩矩阵:矩阵

A

\pmb{A}

AA的行(列)向量线性无关,则称

A

\pmb{A}

AA是行(列)满秩矩阵。

满秩分解:设

A

\pmb{A}

AA

m

×

n

m\times n

m×n阵,

A

\pmb{A}

AA的秩

r

r

r,则存在

m

×

r

m\times r

m×r列满秩矩阵

F

\pmb{F}

FF

r

×

n

r\times n

r×n行满秩矩阵

G

\pmb{G}

GG,使得

A

=

F

G

\pmb{A}=\pmb{F} \pmb{G}

AA=FFGG

分解的方法:将矩阵

A

\pmb{A}

AA使用初等变换化成阶梯形,然后根据行和列的线性无关组构造出列满秩和行满秩矩阵。

正交满秩分解定理:设

A

\pmb{A}

AA

m

×

n

m\times n

m×n阶实矩阵,

A

\pmb{A}

AA的秩是

r

r

r,则存在

m

×

r

m\times r

m×r列正交矩阵

W

\pmb{W}

WW和行满秩的

r

×

n

r \times n

r×n

R

\pmb{R}

RR,使得

A

=

W

R

\pmb{A}=\pmb{W}\pmb{R}

AA=WWRR。其中

W

\pmb{W}

WW满足

W

T

W

=

E

r

\pmb{W}^T\pmb{W}=\pmb{E}_r

WWTWW=EEr

谱分解:

矩阵的谱分解:若

A

\pmb{A}

AA可对角化,即存在可逆矩阵

P

\pmb{P}

PP,使得

P

1

A

P

=

d

i

a

g

{

λ

1

,

λ

1

,


,

λ

n

}

\pmb{P}^{-1}\pmb{A}\pmb{P}=diag\{\lambda_1, \lambda_1,\cdots,\lambda_n\}

PP1AAPP=diag{λ1,λ1,,λn},其中的

{

λ

1

,

λ

1

,


,

λ

n

}

\{\lambda_1, \lambda_1,\cdots,\lambda_n\}

{λ1,λ1,,λn}是矩阵的特征值。设

P

=

(

α

1

,

α

2

,


,

α

n

)

,
 ⁣

P

1

=

(

β

1

,

β

2

,


,

β

n

)

T

\pmb{P}=(\alpha_1,\alpha_2,\cdots,\alpha_n),\! \pmb{P}^{-1}=(\beta_1,\beta_2,\cdots,\beta_n)^T

PP=(α1,α2,,αn),PP1=(β1,β2,,βn)T.则:

A

=

i

=

1

n

λ

i

α

i

β

i

T

\pmb{A}=\sum_{i=1}^n\lambda_i\pmb{\alpha}_i\pmb{\beta}_i^T

AA=i=1nλiααiββiT
矩阵谱分解的必要条件:矩阵可对角化。

分解的方法:求

A

\pmb{A}

AA的特征值和特征向量,特征向量组成的矩阵求逆。

奇异值分解:

奇异值分解:设

A

\pmb{A}

AA

m

×

n

m\times n

m×n的实矩阵,半正定矩阵

A

T

A

\pmb{A}^T\pmb{A}

AATAA的n个特征值是

λ

1

,

λ

2

,


,

λ

n

\lambda_1, \lambda_2,\cdots,\lambda_n

λ1,λ2,,λn。显然

λ

i

0

\lambda_i\geq 0

λi0.称

σ

i

=

λ

i

,

(

i

=

1

,

2

,


,

n

)

\sigma_i=\sqrt{\lambda_i},(i=1,2,\cdots,n)

σi=λi
,(i=
1,2,,n)
是矩阵的奇异值。设奇异值中有

r

r

r个不等于0,记作

σ

1

σ

2

σ

r

>

0

\sigma_1 \geq \sigma_2 \geq \cdots \geq \sigma_r > 0

σ1σ2σr>0,并且设矩阵

D

=

d

i

a

g

{

σ

1

,

σ

2

,


,

σ

r

}

\pmb{D}=diag\{\sigma_1,\sigma_2,\cdots,\sigma_r \}

DD=diag{σ1,σ2,,σr}。令

m

×

n

m \times n

m×n阶矩阵

Σ

\Sigma

Σ :

Σ

=

[

D

O

O

O

]

\pmb{\Sigma}=\begin{bmatrix} \pmb{D} & \pmb{O} \\ \pmb{O} & \pmb{O}\end{bmatrix}

ΣΣ=[DDOOOOOO]
则存在正交矩阵

U

\pmb{U}

UU

V

\pmb{V}

VV:

A

=

U

Σ

V

T

\pmb{A}=\pmb{U}\pmb{\Sigma}\pmb{V}^T

AA=UUΣΣVVT
分解方法:求

A

T

A

\pmb{A}^T\pmb{A}

AATAA的特征值和特征向量。由特征值求奇异值,由特征向量单位正交化求得

V

\pmb{V}

VV,再由

D

\pmb{D}

DD

V

\pmb{V}

VV求得

D

\pmb{D}

DD

(奇异值分解在统计学、信号处理、图像压缩、AI有很多应用)


版权声明:本文为KPer_Yang原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
原文链接:https://blog.csdn.net/KPer_Yang/article/details/126215615