모형 선별의 예당뇨병 진행 경과를 예측하기 위해 다양한 모형의 성능을 평가하려고 합니다. 데이터 집합에는 442명의 당뇨병 환자에 대한 기준 의료 데이터 및 각 환자가 병원에 처음 내원한 후 1년 동안 얻은 당뇨병 진행 경과의 연속형 측정값이 포함되어 있습니다. 병이 많이 진행될수록 값이 높습니다.
1. 도움말 > 샘플 데이터 폴더를 선택하고 Diabetes.jmp를 엽니다.
2. 분석 > 예측 모델링 > 모형 선별을 선택합니다.
3. Y를 선택하고 Y, 반응을 클릭합니다.
4. Age ~ Glucose를 선택하고 X, 요인을 클릭합니다.
5. "폴드 교차 검증" 섹션에서 K 폴드 교차 검증 옆의 상자를 선택합니다.
6. (선택 사항) "작업 옵션" 섹션에서 난수 시드값 설정 옆에 "42920"을 입력합니다.
예제 결과와 일치시키려면 난수 시드값을 사용하십시오.
7. 확인을 클릭합니다.
8. "Y에 대한 모형 선별" 옆의 빨간색 삼각형을 클릭하고 선택적 보고서 > 경과 시간을 선택합니다.
그림 10.2 연속형 반응에 대한 모형 보고서
전체 폴드에서 평균화된 검증 R²을 기반으로 하는 최적 성능 모형은 "부스트된 신경망"입니다. "부스트된 신경망"의 평균 검증 R²은 0.5503입니다. "경과 시간" 보고서에 따르면 "부스트된 신경망" 모형이 적합 시간도 가장 오래 걸렸습니다. 이 경우 경과 시간은 5초에 불과하지만 데이터 집합이 크거나 모형이 복잡한 경우에는 이 정보가 중요할 수 있습니다.
팁: 개별 모형의 성능 측정 기준을 보려면 "검증" 옆의 회색 표시 아이콘을 클릭하십시오.