n 表示观测数,用 p 表示关注的多元分析中涉及的变量数。用 X 表示数据值的 n x p 矩阵。
通常对标准化数据应用 SVD。要将某个值标准化,需减去其均值,再除以其标准差。用 Xs 来表示标准化数据值的 n x p 矩阵。之后,标准化数据的协方差矩阵成为 X 的相关性矩阵,它的计算公式如下:
可以对 Xs 应用 SVD 来获取 Xs’Xs 的特征向量和特征值。当矩阵 X 很宽(很多列)或很高(很多行)时,这样做可以高效计算特征向量和特征值。此方法是宽 PCA 的基础。请参见“主成分”报表