主成分分析(PCA; Principal Component Analysis)は、複数の変数における変動をできるだけ説明する、少数の独立した線形結合(主成分)を求めます。主成分分析は次元を削減する手法であり、探索的データ分析(EDA; Exploratory Data Analysis)の手法の1つです。主成分回帰(PCR; PCA regression)によって予測モデルを作成するときにも使えます。
「主成分分析」プラットフォームは、主成分分析を計算するアルゴリズムとして、大きく分けて2種類の方法を提供します。「従来の方法」の手法では、内部的な計算として、相関係数行列・共分散行列・積和行列のいずれかがまず計算され、それらの行列に対する固有値分解により主成分分析が計算されます。「詳細」手法では、主成分分析を計算するのに、特異値分解に基づく様々なアルゴリズムが使われます。
「詳細」手法は、変数の個数が非常に多いデータに有用であり、短時間で主成分分析を計算することができます。ほとんどの「詳細」手法では、求める主成分の個数(「成分の数」)を指定する必要があります。通常、「成分の数」にはデータの次元よりもかなり小さい値を指定します。主成分スコアをデータテーブルに保存すれば、それをもとに主成分回帰が行えます。
また、因子分析を行うには、専用の「因子分析」プラットフォームがありますが、「主成分分析」プラットフォームでも因子分析を行うことができます。JMPの因子分析では、抽出した因子を解釈しやすくするために、いくつかの直交回転や斜交回転が用意されています。因子分析については、因子分析を参照してください。
図4.1 主成分分析の例