이 예에서는 파티션 플랫폼을 사용하여 당뇨병 환자의 1년 질병 진행률(양적 척도로 측정)을 예측하는 의사 결정 나무를 생성합니다.
1. 도움말 > 샘플 데이터 폴더를 선택하고 Diabetes.jmp를 엽니다.
2. 분석 > 예측 모델링 > 파티션을 선택합니다.
3. Y를 선택하고 Y, 반응을 클릭합니다.
4. Age ~ Glucose를 선택하고 X, 요인을 클릭합니다.
5. 설치된 JMP 유형에 따라 검증 절차를 선택합니다.
– JMP Pro의 경우 Validation을 선택하고 검증을 클릭합니다.
– JMP의 경우 검증 데이터 비율에 "0.3"을 입력합니다.
참고: 검증 행의 랜덤 선택으로 인해 검증 비율을 사용한 결과는 여기에 표시된 것과 다를 수 있습니다.
그림 4.12 검증 데이터 비율 = 0.3인 완료된 시작 창
6. 확인을 클릭합니다.
7. 플랫폼 보고서 창에서 분할을 한 번 클릭하여 분할을 수행합니다.
그림 4.13 의사 결정 나무가 숨겨진 첫 번째 분할 후 보고서
훈련 데이터 집합의 원래 값 309개가 다음과 같이 두 부분으로 분할되었습니다.
– 왼쪽 잎(LTG < 4.6444)에 165개의 관측값이 있습니다.
– 오른쪽 잎(LTG >= 4.6444)에 144개의 관측값이 있습니다.
다음에는 오른쪽 잎과 왼쪽 잎 모두 BMI에서 분할됩니다. BMI에 대한 후보 SS는 오른쪽 잎의 값이 왼쪽 잎의 값보다 높습니다. 따라서 다음 분할은 오른쪽 잎에서 수행됩니다.
8. 시작을 클릭하여 자동 분할을 사용합니다.
그림 4.14 검증을 사용한 자동 분할 후 보고서
네 개의 분할이 포함된 해를 찾았습니다. "분할 기록" 그림에서는 4번의 분할 후 검증 데이터 집합에서 더 이상 개선이 없음을 보여 줍니다. 검증 데이터의 R² 값 0.39는 이 모형이 질병 진행의 강력한 예측 변수로 도움 되지 않음을 나타냅니다. 분할 그림에서 각 파티션 간 산포는 이 모형이 Y 수준을 잘 분리하지 않음을 나타냅니다.