이 예에서는 데이터의 군집을 조사하기 위해 2009년 인구 1,000명당 조출생률 및 사망률을 기준으로 여러 국가를 그룹화합니다.
1. 도움말 > 샘플 데이터 폴더를 선택하고 Birth Death Subset.jmp를 엽니다.
2. 분석 > 군집화 > 계층적 군집화를 선택합니다.
3. birth와 death를 선택하고 Y, 열을 클릭합니다.
4. country를 선택하고 라벨을 클릭합니다.
이렇게 선택하고 "확인"을 클릭하면 표시된 덴드로그램에 행 번호 대신 country 열을 사용하여 라벨을 지정할 수 있습니다.
5. 확인을 클릭합니다.
6. "계층적 군집화"의 빨간색 삼각형을 클릭하고 군집 색 표시를 선택합니다.
그림 13.2 계층적 군집화 보고서
덴드로그램에는 군집화 수행 방법이 표시됩니다. 덴드로그램을 왼쪽에서 오른쪽으로 읽으면 군집화 과정을 볼 수 있습니다. 각 단계는 가장 가까운 두 군집을 단일 군집으로 결합하는 것으로 구성됩니다.
덴드로그램에서 군집 간의 상대 거리는 군집을 연결하는 세로선 사이의 가로 거리로 지정됩니다. 예를 들어 예를 들어 Mexico와 Venezuela로 구성된 군집과의 차이는 Malaysia보다 Afghanistan과 Zaire가 더 큽니다.
다이아몬드는 네 개의 군집 위치에서 설정됩니다. 네 개의 군집 모형을 형성하기 위해 가장 최근에 결합된 두 군집은 Algeria ~ Bangladesh로 구성된 군집과 Iraq ~ Saudi Arabia로 구성된 군집입니다. 이러한 두 군집 간의 거리는 다이아몬드가 4로 설정될 때 거리 그림에서 세로선으로 표시된 점입니다. 거리는 "군집화 기록" 보고서에서 "군집 수" = 4 옆에 제공됩니다. 여기서 거리는 1.618708760이고, Algeria와 Iraq로 시작하는 군집이 결합되어 네 개의 군집을 생성한다는 것을 알 수 있습니다.
거리 그래프를 보면 네 개의 군집에서 기울기가 눈에 띄게 변했습니다. 기울기 변화는 네 개의 군집이 남아 있는 점까지 결합된 군집의 차이가 비교적 작다는 것을 나타냅니다. 따라서 군집 수를 4로 선택하는 것이 좋습니다. 이 값은 기본적으로 표시된 군집 수입니다.
7. "계층적 군집화"의 빨간색 삼각형을 클릭하고 성운형 그림을 선택합니다.
그림 13.3 성운형 그림
이 성운형 그림은 국가를 끝점으로 배열하고 각 군집 결합을 새 점으로 배열합니다. 선은 소속 군집을 나타냅니다. 군집 결합 사이의 선 길이는 결합된 군집 사이의 거리와 거의 같습니다. 성운형 그림을 보면 Zaire와 Afghanistan을 포함하는 군집과 두 개의 각 주요 군집 간의 거리가 거의 비슷합니다.