예측 정확성을 나타내는 배깅의 예배깅은 표준 오차 및 기타 분포 측도를 통해 예측의 정확성을 나타내는 데도 사용됩니다. "예측 계산식 저장" 옵션을 배깅에 사용할 수 있는 플랫폼에서 새 관측값에 대한 예측을 수행하고 정확도를 확인할 수 있습니다. "예측 계산식 저장" 옵션은 표준 최소 제곱, 일반화 회귀 및 일반화 선형 모형 플랫폼에서 사용할 수 있습니다.
Tiretread.jmp 데이터 테이블에서 ABRASION을 세 가지 요인 변수의 함수로 예측하는 데만 관심이 있다고 가정해 보겠습니다. 이 예에서는 일반화 회귀 모형을 적합시켜 ABRASION을 예측합니다. 그런 다음 해당 모형에 대해 배깅을 수행합니다. 마지막으로 새 관측값에 대한 예측을 수행하고 해당 예측의 정확성을 조사합니다. 이는 예측에 대한 신뢰 구간을 구하여 수행됩니다.
1. 도움말 > 샘플 데이터 폴더를 선택하고 Tiretread.jmp를 엽니다.
2. 분석 > 모형 적합을 선택합니다.
3. ABRASION을 선택하고 Y를 클릭합니다.
4. "분석법" 목록에서 일반화 회귀를 선택합니다.
5. SILICA, SILANE, SULFUR를 선택하고 매크로 > 완전 요인을 클릭합니다.
이렇게 하면 교호작용을 포함한 모든 항이 모형에 추가됩니다.
6. 실행을 클릭합니다.
7. 시작을 클릭합니다.
그림 3.35 일반화 회귀 보고서의 모수 추정값
1. "AICc 검증을 사용한 정규 Lasso 회귀" 옆의 빨간색 삼각형을 클릭하고 프로파일러 > 프로파일러를 선택합니다.
"예측 프로파일러"가 보고서 맨 아래에 나타납니다.
2. "예측 프로파일러"의 빨간색 삼각형을 클릭하고 배깅된 예측 저장을 선택합니다.
3. "붓스트랩 표본 수" 옆에 "500"을 입력합니다.
4. (선택 사항) "난수 시드값" 옆에 "4321"을 입력합니다.
참고: 복원 표집의 랜덤 특성으로 인해 결과가 달라집니다. 이 예에 나오는 것과 정확히 같은 결과를 재현하려면 난수 시드값을 설정합니다.
5. 예측 계산식 저장이 선택되었는지 확인합니다.
6. 확인을 클릭합니다.
참고: 예측 향상을 위한 배깅의 예보다 실행 시간이 더 오래 걸릴 수 있습니다. 표본 수가 많을수록 예측 분포를 더 잘 추정할 수 있습니다.
데이터 테이블로 돌아갑니다. 각 반응 변수에 대해 예측 계산식 <열 이름> 배깅된 평균, <열 이름> 붓스트랩 표준 오차 및 표준 오차 <열 이름> 배깅된 평균이라는 세 개의 새 열이 있습니다. 예측 계산식 ABRASION 배깅된 평균 열이 최종 예측입니다.
이제 데이터 테이블의 각 관측값에 대한 ABRASION 예측과 해당 예측에 대한 표준 오차가 있습니다. SILICA, SILANE, SULFUR의 새 값이 각각 0.9, 43, 2인 관측값이 있다고 가정해 보겠습니다. "예측 계산식 저장" 옵션은 배깅된 각 모형에 대한 회귀 방정식을 저장하므로 ABRASION 반응을 예측하고 해당 예측에 대한 신뢰 구간을 구할 수 있습니다. 따라서 새 요인 값으로 M개의 예측을 수행하여 가능한 예측의 분포를 생성합니다. 평균이 최종 예측이지만 분포를 분석하면 예측의 정확도를 알 수 있습니다.
1. 데이터 테이블에서 행 > 행 추가를 선택합니다.
2. 추가할 행 수 상자에 "1"을 입력하고 확인을 클릭합니다.
3. SILICA 열에서 새 행의 상자에 "0.9"를 입력합니다.
4. SILANE 열에서 새 행의 상자에 "43"을 입력합니다.
5. SULFUR 열에서 새 행의 상자에 "2"를 입력합니다.
새 행의 모든 예측 열이 자동으로 계산됩니다.
그림 3.36 새 행의 값
6. 테이블 > 전치를 선택합니다.
7. ABRASION Bags(500/0)를 선택하고 열 전치를 클릭합니다.
8. 확인을 클릭합니다.
9. 분석 > 분포를 선택합니다.
10. 21행을 선택하고 Y, 열을 클릭합니다.
참고: 21행은 새 관측값의 예측에 해당합니다.
11. 확인을 클릭합니다.
12. "21행" 옆의 빨간색 삼각형을 클릭하고 표시 옵션 > 가로 레이아웃을 선택합니다.
그림 3.37 분포 보고서
Figure 3.37의 "분포" 보고서에는 배깅된 각 모형에서 얻은 ABRASION 예측값의 분포 정보가 포함되어 있습니다. 새 관측값에 대한 ABRASION의 최종 예측은 112.3이며, 이는 M개의 모든 배깅된 예측의 평균입니다. 이 예측의 표준 오차는 6.33입니다. 분위수를 사용하여 새 예측에 대한 신뢰 구간을 생성할 수도 있습니다. 예를 들어 새 예측에 대한 95% 신뢰 구간은 102.09 ~ 127.62입니다.