발행일 : 03/10/2025

Image shown here모형 검증 집합 요약

붓스트랩 포레스트 플랫폼의 "모형 검증 집합 요약" 보고서에는 모든 적합 모형에 대한 적합 통계량이 표시됩니다. 이 보고서는 "붓스트랩 포레스트 규격" 창에서 "여러 항에 대한 다중 적합" 옵션 또는 "설계 조정 테이블 사용" 옵션을 선택한 경우에만 사용할 수 있습니다. 자세한 내용은 Figure 5.10다중 적합 패널에서 확인하십시오.

Image shown here규격

붓스트랩 포레스트 플랫폼의 "규격" 보고서에는 모형 적합에 사용된 설정이 표시됩니다.

Image shown here전체 통계량

붓스트랩 포레스트 플랫폼의 "전체 통계량" 보고서에는 훈련 데이터 집합과 검증 및 테스트 데이터 집합(지정된 경우)에 대한 적합 통계량이 제공됩니다. 보고서의 특정 형식은 반응의 모델링 유형에 따라 다릅니다.

"붓스트랩 포레스트 규격" 창의 "여러 항에 대한 다중 적합" 옵션을 사용하여 여러 모형이 적합된다고 가정해 보겠습니다. 그러면 "전체 통계량" 및 "누적 검증" 보고서에 결과가 표시되는 모형은 검증 데이터 집합의 엔트로피 R² 값(범주형 반응의 경우) 또는 R² 값(연속형 반응의 경우)이 가장 큰 모형입니다.

Image shown here범주형 반응

측도 보고서

훈련 데이터 집합과 검증 및 테스트 데이터 집합(지정된 경우)에 대한 다음 통계량을 제공합니다.

참고: 엔트로피 R² 및 일반화 R²의 경우 값이 1에 가까울수록 더 나은 적합을 나타냅니다. 평균 -Log p, RASE, 평균 절대 편차 및 오분류 비율의 경우 값이 작을수록 더 나은 적합을 나타냅니다.

엔트로피 R²

적합 모형과 상수 확률 모형의 로그 가능도를 비교하는 적합 측도입니다. 값 범위는 0에서 1 사이입니다. 자세한 내용은 엔트로피 R²에서 확인하십시오.

일반화 R²

일반 회귀 모형에 적용할 수 있는 측도입니다. 이 값은 가능도 함수 L을 기반으로 하며 최대값이 1이 되도록 척도화됩니다. 값이 1이면 완벽한 모형을 나타내고 0이면 상수 모형과 같음을 나타냅니다. 일반화 R² 측도는 표준 최소 제곱 설정 시 연속형 정규 반응에 대한 기존 R²으로 단순화됩니다. 일반화 R²을 Nagelkerke 또는 Craig와 Uhler R2이라고도 하는데, 이는 Cox-Snell 유사 R2을 정규화한 것입니다.

평균 -Log P

음의 log(p)의 평균입니다. 여기서 p는 발생한 사건과 연관된 적합 확률입니다.

RASE

제곱근 평균 제곱 예측 오차입니다. 차이는 1에서 p(실제로 발생한 반응 수준의 적합 확률) 사이입니다.

평균 절대 편차

반응과 예측 반응 사이의 차이에 대한 절대값의 평균입니다. 차이는 1에서 p(실제로 발생한 반응 수준의 적합 확률) 사이입니다.

오분류 비율

적합 확률이 가장 높은 반응 범주가 관측된 범주가 아닌 비율입니다.

N

관측값 수입니다.

트리 수

모형에 사용된 실제 트리 수를 표시합니다.

혼동 행렬 보고서

(범주형 반응에만 사용 가능) 훈련 데이터 집합과 검증 및 테스트 데이터 집합(지정된 경우)에 대한 분류 통계량을 표시합니다. "혼동 행렬" 보고서에는 혼동 행렬과 혼동 비율 행렬이 포함됩니다. 혼동 행렬은 실제 반응과 예측 반응의 이원 분류입니다. 혼동 비율 행렬은 값을 행 합계로 나눈 혼동 행렬과 동일합니다.

결정 행렬

(범주형 반응을 사용하고 반응에 "수익 행렬" 열 특성이 있거나 "수익 행렬 지정" 옵션을 사용하여 비용을 지정하는 경우에만 사용 가능) 훈련 데이터 집합과 검증 및 테스트 데이터 집합(지정된 경우)에 대한 결정 개수 및 결정 비율 행렬을 제공합니다. 자세한 내용은 파티션 플랫폼의 추가 예에서 확인하십시오.

Image shown here연속형 반응

R² 및 RASE 보고서

훈련 데이터 집합과 검증 및 테스트 데이터 집합(정의된 경우)에 대한 R², 제곱근 평균 제곱 예측 오차 및 관측값 수를 제공합니다.

트리 수

모형에 사용된 실제 트리 수를 제공합니다.

개별 트리 보고서

모든 트리에 대해 In Bag 관측값과 Out of Bag 관측값의 평균인 RASE 값을 제공합니다. 트리를 생성하는 데 사용된 훈련 데이터 집합 관측값을 In-Bag 관측값이라고 합니다. 트리를 생성하는 데 사용되지 않는 훈련 관측값을 OOB(Out-Of-Bag) 관측값이라고 합니다.

각 트리에 대해 Out of Bag RASE는 오차 제곱합의 제곱근을 OOB 관측값 수로 나눈 값입니다. 각 트리에 대한 Out of Bag RASE 제곱은 "트리별 요약" 보고서에 "OOB SSE/N"으로 제공됩니다.

더 많은 정보를 원하십니까? 질문이 있습니까? JMP 사용자 커뮤니티에서 답변 받기 (community.jmp.com).