n = 行数(標本サイズ)
p = 変数の数
X = データ値のn x p行列
0以外の固有値の個数。これは求められる主成分の個数であり、Xの相関係数行列のランクと同じです。0以外の固有値の数は、npの小さい方を超えることはできません。
推定法として[横長]を選択した場合、データは常に標準化されます。データの標準化とは、データから平均を引き、それを標準偏差で割る変換を指します。標準化したデータを、Xsn x p行列)と記します。標準化していないデータXの相関行列は、標準化したデータの共分散行列です。よって、次のように相関係数行列は求められます。
Xsは、特異値分解した行列によりUDiag(Λ)V’と表されます。この特異値分解により、固有ベクトルとXs’Xsの固有値が求められます。なお、主成分スコアはXsVによって求められます。詳細については、「統計的詳細」の付録「「線形 横長データ」の手法と特異値分解」(279ページ)を参照してください。
第 “横長なデータに対する手法”で説明したXの同じ表記と標準化を使用すると、 Xの相関行列はXsの共分散行列によって次のように表されます。