主成分分析(PCA; Principal Component Analysis)は、複数の変数における変動をできるだけ説明する、少数の独立した線形結合(主成分)を求めます。主成分分析は次元を削減する手法であり、探索的なデータ分析ツールの1つです。主成分回帰(PCA回帰またはPCRともいう)によって予測モデルを作成するときにも使えます。
多くの0があるデータ(疎データ)用には、「疎」推定法が用意されています。「横長」手法と同様に、「疎」手法でも主成分を短時間で算出できます。ただし、「横長」手法とは異なり、「疎」手法では全体ではなくユーザが定義した数の主成分だけが算出されます。
図3.1 主成分分析の例
目次