「Iris.jmp」の正準プロットは、「Iris.jmp」の線形判別分析の「正準プロット」を示しています。点は、「種類」によって色分けされています。
図5.9 「Iris.jmp」の正準プロット
バイプロットの横軸と縦軸は、最初の2つの正準変数です。これらの正準変数は、グループ間の距離が最大となる2次元です。各正準変数はそれぞれ共変量の線形結合です (第 “正準構造”を参照)。このバイプロットを見ると、各オブザベーションがどのように分布しているかや、各共変量が正準変数にどのように寄与しているかがわかります。
この重みを解釈しやすくするために、各共変量は平均が0、標準偏差が1に標準化されます。標準化された共変量に対する係数は、正準重み(canonical weight)と呼ばれています。正準重みが大きいほど、その共変量と正準変数との関係が大きいことを示します。
重みの数値を知るには、赤い三角ボタンのメニューから[正準オプション]>[正準の詳細を表示]を選択してください。そして、「正準の詳細」レポートの最下部で「標準化スコア係数」を開いてください。詳細は、第 “標準化スコア係数”の節を参照してください。
95%信頼楕円の表示/非表示は、[正準オプション]>[平均の信頼限界楕円の表示]で切り替えます。
バイプロット線の表示/非表示は、[正準オプション]>[バイプロット線の表示]で切り替えます。
バイプロット線の中心は、ドラッグして別の位置へ移動することができます。バイプロット線の位置およびスケールを指定するには、赤い三角ボタンのメニューから[正準オプション]>[パイプロット線の位置]を選択します。正準プロットに表示されるデフォルトの半径のスケールは、調整しないとバイプロット線が見えない場合を除き、1.5です。
50%等高線の表示/非表示は、[正準オプション]>[正規50%等高線の表示]で切り替えます。
楕円と一致するように点を色分けするには、赤い三角ボタンのメニューから[正準オプション]>[プロット点の色分け]を選択します。
「Iris.jmp」データの場合は3つの「種類」があるので、正準変数は2つだけです。「Iris.jmp」の正準プロットのプロットを見ると、2つの正準変数で3つのグループがいい具合に分かれていることがわかります。
「花弁の長さ」は、「正準1」と正の関連性があり、「正準2」と負の関連性があります。「正準2」よりも「正準1」の定義における重みのほうが大きいです。
「花弁の幅」は、「正準1」と「正準2」の両方に正の関連性があります。両正準変数の定義における重みは同じくらいです。
「がくの幅」は、「正準1」と負の関連性があり、「正準2」と正の関連性があります。「正準1」よりも「正準2」の定義における重みのほうが大きいです。
「がくの長さ」は、「正準1」と負の関連性があり、「正準2」との関連性はほとんどありません。
「Fitness.jmp」の正準プロットは、「Fitness.jmp」サンプルデータの正準プロットです。被験者をM(男性)とF(女性)のカテゴリに分類するために、7つの連続変数が使用されます。分類変数には2つのカテゴリしかないので、正準変数は1つだけです。
図5.10 「Fitness.jmp」の正準プロット
「Fitness.jmp」の正準プロットの点は、「性別」で色分けされています。2つのグループが「正準1」の値ではっきりと分かれていることに注目してください。
「最大脈拍」「走行時間」「走行時の脈拍」は「正準1」とあまり関連がありません。
「体重」「休息時の脈拍」「年齢」は「正準1」と正の関連があり、 このうち「体重」が最も関連が強いです。共変量「休息時の脈拍」と「年齢」は共に関連性が低いです。
「酸素摂取量」は「正準1」と負の関連性があります。