이 예에서는 SVR(서포트 벡터 회귀)을 사용하여 연속형 반응을 모델링합니다. SVR 모형은 SVM 알고리즘을 사용하여 연속형 반응 데이터를 예측합니다. 서포트 벡터 머신의 예에서 사용된 것과 동일한 당뇨병 환자 의료 데이터를 사용합니다. 그러나 당뇨병 진행 경과의 이진 측정값 대신 연속형 측정값이 제공됩니다. 병이 많이 진행될수록 값이 높습니다. 방사 기저 함수의 비용 모수를 변경하여 최량 적합 모형을 찾을 수 있습니다.
1. 도움말 > 샘플 데이터 폴더를 선택하고 Diabetes.jmp를 엽니다.
2. 분석 > 예측 모델링 > 서포트 벡터 머신을 선택합니다.
3. Y를 선택하고 Y, 반응을 클릭합니다.
4. Age ~ Glucose를 선택하고 X, 요인을 클릭합니다.
5. Validation을 선택하고 검증을 클릭합니다.
6. 확인을 클릭합니다.
7. "모형 시작" 제어판에서 커널 함수가 "방사 기저 함수"이고 "비용" 모수가 1, "감마" 모수가 0.1인지 확인합니다.
8. 시작을 클릭합니다.
9. "모형 시작" 옆의 회색 삼각형을 클릭하여 "모형 시작" 제어판을 엽니다.
10. 비용 모수를 0.1로 변경합니다.
11. 시작을 클릭합니다.
12. "모형 시작" 옆의 회색 삼각형을 클릭하여 "모형 시작" 제어판을 엽니다.
13. 비용 모수를 2로 변경합니다.
14. 시작을 클릭합니다.
그림 9.6 모형 비교 보고서
"모형 비교" 보고서에는 서로 다른 비용 모수를 사용한 모형의 결과가 포함되어 있습니다. 비용 모수가 높을수록 점을 잘못 분류할 가능성이 낮은 알고리즘이 구현되는 반면, 비용 모수가 낮을수록 더 유연한 알고리즘이 구현됩니다. 이 시나리오에서는 더 유연한 모형, 즉 비용 모수가 0.1인 모형이 최적 모형 적합을 생성합니다.
15. "모형 비교" 보고서의 "표시" 열에서 "모형 1"과 "모형 3"을 선택 취소합니다.
그림 9.7 연속형 반응에 대한 모형 보고서
연속형 반응에 대한 모형 보고서에는 "모형 요약", "추정 상세 정보" 및 "실제값 대 예측값 그림"이 포함됩니다. "모형 요약" 보고서에서 훈련 데이터 집합의 RASE는 52.58, 검증 데이터 집합의 RASE는 57.50입니다.