多変量分析 > 階層型クラスター分析 > クラスター分析の例
公開日: 11/25/2021

クラスター分析の例

この例では、1976年の10万人あたりの租出生率と租死亡率によって国をグループ分けします。

1. [ヘルプ]>[サンプルデータライブラリ]を選択し、「Birth Death Subset.jmp」を開きます。

2. [分析]>[クラスター分析]>[階層型クラスター分析]を選択します。

3. 「租出生率」「租死亡率」を選択し、[Y, 列]をクリックします。

4. 「国」を選択して[ラベル]をクリックします。

これにより、[OK]をクリックして表示される樹形図には行番号ではなく「国」列の値がラベルとして表示されます。

5. [OK]をクリックします。

6. 「階層型クラスター分析」の赤い三角ボタンをクリックし、[クラスターの色分け]を選択します。

図12.2 「階層型クラスター分析」レポート 

Hierarchical Clustering Report

樹形図はクラスタリングの実行結果を示しています。クラスタリングの過程は、樹形図を左から右へとたどると確認できます。各ステップで、最も距離が近い2つのクラスターを、1つのクラスターに結合しています。

樹形図では、クラスター間の相対的な距離は、クラスターを結合している縦線間の横の距離によって判断できます。たとえば、AfghanistanとZaireの違いは、MexicoとVenezuelaで構成されるクラスターとMalaysiaとの違いより大きいことを示しています。

樹形図の下に表示されているプロットには、2つのクラスターが1つのクラスターに結合される各ステップの点があります。横軸はクラスターの数で、左から右にいくにつれ減少します。縦軸は、該当の数のクラスターを構成するために結合された2つのクラスター間の距離です。樹形図のひし形のどちらかをクリックしてドラッグし、データを最も良く表しているクラスターの数を選択できます。「階層型クラスター分析」の赤い三角ボタンをクリックし、[クラスターの数]を選択して、クラスターの数を指定することもできます。

距離グラフでは、クラスターが4つのところで線の傾きが急になっています。この傾きの変化は、クラスターが4つになるまでに結合されたクラスター間の違いが比較的小さいことを示しています。つまり、クラスター数4が最良の選択であることを示しています。このクラスター数は、デフォルトで示された数であることに注意してください。

7. 「階層型クラスター分析」の赤い三角ボタンをクリックし、[星座樹形図]を選択します。

図12.3 星座樹形図 

Constellation Plot

この星座樹形図は、国を端点、各クラスター結合を新しい点として表しています。線はクラスター内の所属関係を表します。クラスター結合間の線の長さは、結合されたクラスター間のおおよその距離を表します。星座樹形図から、AfghanistanとZaireを含むクラスターが、プロットの上半分と下半分にある残りの国で構成された2つのクラスターから、等しく離れていることがわかります。

より詳細な情報が必要な場合や、質問があるときは、JMPユーザーコミュニティで答えを見つけましょう (community.jmp.com).