协方差矩阵与矩阵分解¶
1 协方差矩阵定义¶
2 协方差矩阵的半正定性质¶
- 协方差矩阵为半正定矩阵
证明:
3 相似对角化¶
- 定义:设A为n阶对称矩阵,则必有正交矩阵U,使得
是对角线上的元素从大到小排列的特征值的对角阵
-
理论基础:实对称矩阵的特征值为实数,实对称矩阵不同特征值的特征向量相互正交。
-
(题外话) 对于任意方阵,不同特征值之间特征向量线性无关
-
证明1
-
设是不同特征值, 且线性无关的特征向量
-
加入一个, 其对应特征值为, 因此对于, 若
-
两侧同时左乘, 得到
-
两侧同时左乘, 得到
-
由, 得
-
由于, 所以
-
由, 可得, 因此也线性无关
-
因此进行数学归纳,可证明不同特征值之间特征向量线性无关
-
证明2
-
设特征向量的极大无关组为, 对于来说,若其任意一个特征向量与特征向量线性相关,等价于可由线性表示
- 这是因为若可由线性表示, 则显然线性相关
- 若线性相关,则存在系数非0解,因此一定不等于1(否则所有系数都是1),因此, 可线性表示
-
因此设, 则 这与矛盾,证毕
-
-
实对称矩阵不同特征值的特征向量相互正交
-
设两个不同特征值为, 设其对应的特征向量分别是,有 因此,不同特征值之间特征向量正交
-
对于同一个特征值,只需要特征向量对极大无关组做
-
-
构造:
-
证明: 注意,经过施密特正交化的,仍然是由特征向量拼起来的。但是他的特征向量与不同,是通过特征子空间依次施密特正交化得来的。
-
实际意义
-
的意义: 可以理解为,x在特征向量方向商分别增加倍,也就是在U坐标下单位圆变成椭圆。
-
的意义 即为在特征向量正交基下的坐标二次方乘以特征值后求和
4 奇异值分解¶
-
定义:相似对角化对矩阵有着较高的要求,它需要被分解的矩阵为实对称矩阵,但是现实中,我们所遇到的问题一般不是实对称矩阵。那么当我们碰到一般性的矩阵,即有一个的矩阵A,它是否能被分解成类似的形式。
-
证明:
-
证明1
-
证明2
-
奇异值分解的想法:对任意的矩阵,能否找到一组正交基使得经过它变换后还是正交基
-
由于 对称,可以进行特征值分解为
-
因此可以得到一组正交基, 且有
-
因为, 所以, 因此中有个向量可以构成正交基的一部分,设为前个并且标准化,而必定都是0向量
-
对标准化得到
-
且一定是列空间的一组正交基
-
然后对扩充到的一组标准正交基
-
因此有
-
这就表明任意的矩阵 是可以分解成三个矩阵。 表示了原始域的标准正交基, 表示经过 A 变换后的co-domain的标准正交基, 表示了 中的向量与 中相对应向量之间的关系
-
求解方法:
由于和都是对称矩阵,此即相似对角化的结果,为的特征向量为列向量的矩阵,为的特征向量为列向量的矩阵,奇异值可以有或者的特征值(因为是正定矩阵,所以特征值非负)开方得到。
-
意义:奇异值可以被看作成一个矩阵的代表值,或者说,奇异值能够代表这个矩阵的信息。当奇异值越大时,它代表的信息越多。因此,若前面若干个最大的奇异值,就可以基本上还原出数据本身。
-
分析思想去理解奇异值:
- 代数思想理解奇异值:
可以看V正交系下的单位圆变换到新的正交系下的椭圆。
-
Thin Svg与矩阵的满秩分解
-
概念:设矩阵, 且, 则可以分解为 其中和的每一行都相互正交
-
证明:
-
由于可以经过奇异值分解为
-
对进行分块
-
对进行分块
-
由, 所以对角线只有前个有值
-
因此,奇异值分解可以写作
-
其中和均分别取和的前列即可
-
-
有Thin奇异值分解后结构可以看到,可以被满秩分解为
-
如何求伪逆
可以看到的伪逆可以是
5 协方差矩阵的特征向量和特征值¶
- 特征向量和特征值的含义
由此可见,特征值负责尺度变换,特征向量负责旋转。的特征向量为样本的变换轴,变化的倍数为, 即从变为, 。
-
多元正态分布中的协方差矩阵
-
在多元正态分布中
由此可以得知,一般的多元正态分布是将变换到不相关的标准多元正态分布