跳转至

协方差矩阵与矩阵分解

1 协方差矩阵定义

2 协方差矩阵的半正定性质

  1. 协方差矩阵为半正定矩阵

证明:

3 相似对角化

  1. 定义:设A为n阶对称矩阵,则必有正交矩阵U,使得

是对角线上的元素从大到小排列的特征值的对角阵

  1. 理论基础:实对称矩阵的特征值为实数,实对称矩阵不同特征值的特征向量相互正交。

  2. (题外话) 对于任意方阵,不同特征值之间特征向量线性无关

    • 证明1

    • 不同特征值, 且线性无关的特征向量

    • 加入一个, 其对应特征值为, 因此对于, 若

    • 两侧同时左乘, 得到

    • 两侧同时左乘, 得到

    • , 得

    • 由于, 所以

    • , 可得, 因此也线性无关

    • 因此进行数学归纳,可证明不同特征值之间特征向量线性无关

    • 证明2

    • 特征向量的极大无关组为, 对于来说,若其任意一个特征向量特征向量线性相关,等价于可由线性表示

      • 这是因为若可由线性表示, 则显然线性相关
      • 线性相关,则存在系数非0解,因此一定不等于1(否则所有系数都是1),因此, 可线性表示
    • 因此设, 则 这与矛盾,证毕

  3. 实对称矩阵不同特征值的特征向量相互正交

    • 设两个不同特征值为, 设其对应的特征向量分别是,有 因此,不同特征值之间特征向量正交

    • 对于同一个特征值,只需要特征向量对极大无关组做

  4. 构造:

  5. 证明: 注意,经过施密特正交化的,仍然是由特征向量拼起来的。但是他的特征向量与不同,是通过特征子空间依次施密特正交化得来的。

  6. 实际意义

  7. 的意义: 可以理解为,x在特征向量方向商分别增加倍,也就是在U坐标下单位圆变成椭圆。

  8. 的意义 即为在特征向量正交基下的坐标二次方乘以特征值后求和

4 奇异值分解

  1. 定义:相似对角化对矩阵有着较高的要求,它需要被分解的矩阵为实对称矩阵,但是现实中,我们所遇到的问题一般不是实对称矩阵。那么当我们碰到一般性的矩阵,即有一个的矩阵A,它是否能被分解成类似的形式。

  2. 证明:

  3. 证明1

  • 证明2

  • 奇异值分解的想法:对任意的矩阵,能否找到一组正交基使得经过它变换后还是正交基

  • 由于 对称,可以进行特征值分解为

  • 因此可以得到一组正交基, 且有

  • 因为, 所以, 因此中有个向量可以构成正交基的一部分,设为前个并且标准化,而必定都是0向量

  • 标准化得到

  • 一定是列空间的一组正交基

  • 然后对扩充到的一组标准正交基

  • 因此有

  • 这就表明任意的矩阵 是可以分解成三个矩阵。 表示了原始域的标准正交基, 表示经过 A 变换后的co-domain的标准正交基, 表示了 中的向量与 中相对应向量之间的关系

  • 求解方法:

​ 由于都是对称矩阵,此即相似对角化的结果,的特征向量为列向量的矩阵,的特征向量为列向量的矩阵,奇异值可以有或者的特征值(因为是正定矩阵,所以特征值非负)开方得到。

  1. 意义:奇异值可以被看作成一个矩阵的代表值,或者说,奇异值能够代表这个矩阵的信息。当奇异值越大时,它代表的信息越多。因此,若前面若干个最大的奇异值,就可以基本上还原出数据本身。

  2. 分析思想去理解奇异值:

  1. 代数思想理解奇异值:

可以看V正交系下的单位圆变换到新的正交系下的椭圆。

  1. Thin Svg与矩阵的满秩分解

  2. 概念:设矩阵, 且, 则可以分解为 其中的每一行都相互正交

  3. 证明:

    • 由于可以经过奇异值分解为

    • 进行分块

    • 进行分块

    • , 所以对角线只有前个有值

    • 因此,奇异值分解可以写作

    • 其中均分别取的前列即可

  4. 有Thin奇异值分解后结构可以看到,可以被满秩分解为

  5. 如何求伪逆

    可以看到的伪逆可以是

5 协方差矩阵的特征向量和特征值

  1. 特征向量和特征值的含义

​ 由此可见,特征值负责尺度变换,特征向量负责旋转。的特征向量为样本的变换轴,变化的倍数为, 即从变为,

  1. 多元正态分布中的协方差矩阵

  2. 在多元正态分布中

由此可以得知,一般的多元正态分布是将变换到不相关的标准多元正态分布