跳转至

主成分分析法

1 问题描述

  • 给定一组向量,求其主成分方向

2 问题求解

  • 中心化,其中心化后表示为

  • 优化目标:选择单位向量, 最大化样本方差

  • 求解1:使用拉格朗日法

  • 优化目标

  • 拉格朗日函数为

  • 求导得

  • 可以得出

  • 可见,当的特征向量时,上式即可变为局部最大值,且最大值特征向量对应的特征值

  • 求解2:使用奇异值

  • 对于来说,是一个对称的矩阵,对称阵不同特征值对应的特征向量两两正交,并且这组特征向量构成了空间中的一组单位正交基

  • 因此

  • 可以得到结论

  • 是最大特征对于特征向量时, 最大,且

  • 第一主轴已经找到,第二主轴为次大特征值对应的特征向量的方向,以此类推

    • 这是因为后面的主成分方向在与前一个保持正交的前提下有最大的方差,因此第二主成分方向是剩余的特征向量的线性组合(对称阵特征向量两两正交),因此第二主轴为次大特征值对应的特征向量的方向