예측 및 전문 모델링 > 모형 선별 > 모형 선별 보고서 > 훈련, 검증 및 테스트 적합 측도
발행일 : 03/10/2025

훈련, 검증 및 테스트 적합 측도

모형 선별 플랫폼에는 지정된 각 모형 데이터 집합에 대한 적합 측도 보고서가 있습니다. 훈련 데이터 집합, 훈련 및 검증 데이터 집합 또는 훈련, 검증 및 테스트 데이터 집합이 될 수 있습니다. 각 보고서에는 다음 열을 포함하는 테이블이 있습니다.

방법

모형을 적합시키는 데 사용된 방법의 이름입니다.

N

데이터 집합의 관측값 수입니다.

가중치 합

가중치의 합입니다.

(연속형 반응에만 사용 가능) 적합 모형의 R² 값입니다.

엔트로피 R²

(범주형 반응에만 사용 가능) 적합 모형과 상수 확률 모형의 로그 가능도를 비교하는 적합 측도입니다. 엔트로피 R² 범위는 0 ~ 1이며, 값이 1에 가까울수록 더 나은 적합을 나타냅니다. 자세한 내용은 엔트로피 R²에서 확인하십시오.

오분류 비율

(범주형 반응에만 사용 가능) 모형에 의해 잘못 분류된 관측값의 비율입니다. 값이 작을수록 더 나은 적합을 나타냅니다.

참고: 이러한 테이블에서 오분류 비율은 항상 확률 임계 0.5를 사용하여 계산됩니다.

AUC

(범주형 반응에만 사용 가능) ROC 곡선 아래 면적입니다. 값이 1에 가까울수록 더 나은 적합을 나타냅니다.

RASE

평균 제곱 예측 오차의 제곱근입니다(제곱근 평균 제곱 오차). RASE는 다음과 같이 계산되며, 여기서 Source는 훈련, 검증 또는 테스트 데이터 집합을 나타냅니다.

Equation shown here

일반화 R²

(범주형 반응에만 사용 가능) 일반 회귀 모형에 적용할 수 있는 측도입니다. 이 값은 가능도 함수 L을 기반으로 하며 최대값이 1이 되도록 척도화됩니다. 값이 1이면 완벽한 모형을 나타내고 0이면 상수 모형과 같음을 나타냅니다. 일반화 R² 측도는 표준 최소 제곱 설정 시 연속형 정규 반응에 대한 기존 R²으로 단순화됩니다. 일반화 R²을 Nagelkerke 또는 Craig와 Uhler R2이라고도 하는데, 이는 Cox-Snell 유사 R2을 정규화한 것입니다. 자세한 내용은 Nagelkerke 연구 자료(1991)에서 확인하십시오.

폴드

(시작 창에서 "K 폴드 교차 검증" 옵션 또는 "내포 교차 검증" 옵션을 지정한 경우에만 사용 가능) 해당 행에서 모형 적합을 위해 홀드아웃된 폴드를 식별합니다.

내측 폴드

(시작 창에서 "내포 교차 검증" 옵션을 지정한 경우에만 사용 가능) 해당 행에서 모형 적합을 위해 홀드아웃된 내측 폴드를 식별합니다.

시행

(시작 창에서 "반복 K 폴드" 옵션을 지정한 경우에만 사용 가능) 해당 행에서 모형 적합에 대한 시행 번호를 식별합니다.

각 테이블 아래에 다음과 같은 옵션이 있습니다.

우월 행 선택

모형 적합 기준 조합에 따라 다른 모든 모형보다 우수하거나 동일한 각 모형을 선택합니다. 연속형 반응의 경우 우월 모형을 결정할 때 R²과 빈도 합을 고려합니다. 범주형 반응의 경우 우월 모형을 결정할 때 엔트로피 R², 오분류 비율, AUC 및 빈도 합을 고려합니다.

선택 항목 실행

선택한 각 행에 지정된 개별 모형을 실행합니다.

선택한 스크립트 저장

선택한 각 행의 스크립트 창에 모형 스크립트를 저장합니다.

더 많은 정보를 원하십니까? 질문이 있습니까? JMP 사용자 커뮤니티에서 답변 받기 (community.jmp.com).