主成分分析(PCA; Principal Component Analysis)は、複数の変数における変動をできるだけ説明する、少数の独立した線形結合(主成分)を求めます。主成分分析は次元を削減する手法であり、探索的データ分析(EDA; Exploratory Data Analysis)の手法の1つです。主成分回帰(PCR)によって予測モデルを作成するときにも使えます。
多くの0があるデータ(疎データ)に対する分析のために、「疎」(sparse)というオプションも用意されています。「横長」オプションと同様、「疎」オプションも計算時間が短くなります。ただし、「横長」オプションとは異なり、「疎」オプションはすべての次元ではなく、ユーザが指定した個数だけ主成分が算出されます。
図4.1 主成分分析の例
目次