n = 行数
p = 变量数
X = 数据值的 n x p 矩阵
非零特征值数以及得到的主成分数均等于 X 的相关性矩阵的秩。非零特征值数不得超过 n p 中较小的那个值。
若选择“宽”方法,数据将被标准化。要将某个值标准化,需减去其均值,再除以其标准差。用 Xs 来表示标准化数据值的 n x p 矩阵。之后,标准化数据的协方差矩阵成为 X 的相关性矩阵,它的计算公式如下:
使用奇异值分解,Xs 可表示为 UDiag(Λ)V’。这种表示法用于获取 Xs’Xs 的特征向量和特征值。主成分或得分通过 计算得出。更多背景信息,请参见“宽线性”方法和奇异值分解
稀疏
考虑对中所述的 X 使用相同的符号和标准化。X 的相关性矩阵由 Xs 的协方差矩阵表示: