이 예에서는 당뇨병 진행 경과를 모델링하는 데 사용되는 연속형 기준 변수를 군집화합니다.
1. 도움말 > 샘플 데이터 폴더를 선택하고 Diabetes.jmp를 엽니다.
2. 분석 > 군집화 > 변수 군집화를 선택합니다.
3. Gender를 제외한 Age ~ Glucose 열(Age, BMI, BP, Total Cholesterol, LDL, HDL, TCH, LTG 및 Glucose)을 선택하고 Y, 열을 클릭합니다.
변수 군집화에는 연속형 수치 변수가 필요하므로 Gender 열을 포함할 수 없습니다.
4. 확인을 클릭합니다.
그림 17.2 Diabetes 데이터에 대한 변수 군집화 보고서
"군집 요약" 보고서에는 다음과 같이 변수가 세 개의 군집으로 그룹화되어 있습니다.
• "군집 멤버" 보고서에 표시된 것처럼 군집 1은 TCH, HDL, LTG 및 BMI로 구성됩니다. "군집 요약" 보고서에 따르면 TCH가 군집 1의 가장 대표적인 변수이고, 군집 1 변수의 경우 변동의 62.8%가 첫 번째 주성분에 의해 설명됩니다.
• 군집 2는 Total Cholesterol과 LDL로 구성됩니다. "군집 요약" 보고서에 따르면 Total Cholesterol이 군집 2의 가장 대표적인 변수이고, 군집 2 변수의 경우 변동의 94.8%가 첫 번째 주성분에 의해 설명됩니다.
• 군집 3은 BP, Age 및 Glucose로 구성됩니다. "군집 요약" 보고서에 따르면 BP가 가장 대표적인 변수이고, 군집 3 변수의 경우 변동의 56.2%가 첫 번째 주성분에 의해 설명됩니다.