多変量分析 > K Meansクラスター分析 > 「K Means法」レポート > 「K Means法」レポートのオプション
公開日: 04/01/2021

「K Means法」レポートのオプション

「K Means法」レポートには、次のようなオプションがあります。

バイプロット

クラスターを色分けする凡例とともに、データの主成分のうち最初の2つを軸にして点とクラスターをプロットします。円はクラスターの中心の周囲に描かれ、円の大きさは各クラスターの度数に比例します。陰影が付けられた領域は、平均を中心とした密度の等高線です。デフォルトでは、各クラスター内においてオブザベーション90%が含まれる領域を示しています(Mardia et al. 1980)。プロットの下のリストを使用すれば、第1主成分と第2主成分以外をプロットすることができます。また、矢印ボタンによって、可能な軸の組み合わせをすべて繰り返して表示することもできます。プロットの下には、クラスターの色をデータテーブルに保存するオプションもあります。色をテーブルに保存を参照してください。固有値は降順に表示されています。

注: 起動ウィンドウで[列ごとに標準化]にチェックを入れた場合、バイプロットは相関行列を使用します。[列ごとに標準化]にチェックを入れなかった場合、バイプロットは共分散行列を使用します。

バイプロットオプション

バイプロットの外観をコントロールするための次のようなオプションがあります。

バイプロット線の表示

バイプロット線を表示します。ラベルの付いたバイプロット線は、主成分を基底とした部分空間における変数の方向を示します。バイプロット線は、各変数の各主成分に対する関連の度合を示します。

バイプロット線の位置

バイプロット線の位置と半径のスケールを指定できます。デフォルトでは、点(0,0)を出発点とします。プロットでバイプロット線をドラッグして移動するか、またはこのオプションによって出発点の座標を指定できます。半径のスケールオプションを使ってバイプロット線のスケールを調整し、バイプロット線を見やすくすることもできます。

バイプロットの密度等高線

密度等高線の信頼水準を指定できます。デフォルトの信頼水準は90%です。

クラスターのマーカー分け

データテーブルの各行に、クラスターに応じたマーカーをつけます。

三次元バイプロット

データの3次元バイプロットを表示します。分析に用いた変数が3変数以上の場合のみ使用できます。

パラレルプロット

クラスターごとにパラレルプロットを作成します。オプションで、プロットにおけるデータや平均の表示/非表示を切り替えることができます。『グラフ機能』のパラレルプロットを参照してください。

散布図行列

Y変数をすべて使用した散布図行列を作成します。

色をテーブルに保存

データテーブルの各行に、クラスターに応じたマーカーをつけます。レポートウィンドウに「バイプロット」がある場合、データテーブルに保存された色は、バイプロットのクラスターの色と一致します。バイプロットで色が変更され、「色をテーブルに保存」オプションが再び選択された場合、データテーブルにおける行の色はバイプロットと一致するように更新されます。

注: 以下のいずれかの保存オプションを選択すると、保存された列の[ノート]列プロパティに、そのクラスター数が記録されます。この情報により、異なるクラスターのあてはめから保存オプションを使用して列を複数保存した場合でも、それぞれがどのあてはめのものなのかわかるようになっています。

クラスターの保存

データテーブルに次の2つの列を保存します。

各行に割り振られたクラスターの番号を含む「クラスター」列。

([自己組織化マップ]を選択した場合はこのオプションは表示されません。)各オブザベーション(各データ行)の、それが属するクラスターの平均までののユークリッド距離を2乗した値を含む「距離」列。まず、変数ごとに、オブザベーションとクラスター平均との差を、その変数全体の標準偏差で割ります。これらの標準化した差から変数全体の2乗和を求めます。

クラスター距離の保存

([自己組織化マップ]を選択した場合はこのオプションは表示されません。)「距離」列をデータテーブルに保存します。この列は、「クラスターの保存」オプションで得られた「距離」列と同じです。

クラスター計算式の保存

「クラスター計算式」という計算式列をデータテーブルに保存します。この計算式は、どのクラスターに属するかを求めるものになっています。

距離計算式の保存

([自己組織化マップ]を選択した場合はこのオプションは表示されません。)「距離計算式」と呼ばれる計算式の列をデータテーブルに保存します。これは、割り付けられたクラスターの平均までの距離を2乗した値を計算する式です。

K個のクラスター距離の保存

([自己組織化マップ]を選択した場合はこのオプションは表示されません。)それぞれのクラスターの中心までの距離を2乗した値を含むk列を保存します。

K個の距離計算式の保存

([自己組織化マップ]を選択した場合はこのオプションは表示されません。)それぞれのクラスターの中心までのユークリッド距離を2乗した値を求める計算式を含むk列を保存します。

クラスター計算式の発行

「クラスター計算式の保存」オプションで使用されるのと同じスクリプトを「計算式デポ」に発行します。

クラスターのシミュレーション

クラスターの平均と標準偏差の推定値を使って乱数シミュレーションしたデータを含む、新しいデータテーブルを作成します。

削除

クラスター分析のレポートを削除します。

より詳細な情報が必要な場合や、質問があるときは、JMPユーザーコミュニティで答えを見つけましょう (community.jmp.com).