발행일 : 03/10/2025

Image shown here전체 통계량

부스티드 트리 플랫폼의 "전체 통계량" 보고서에는 훈련 데이터 집합과 검증 및 테스트 데이터 집합(지정된 경우)에 대한 적합 통계량이 표시됩니다.

부스티드 트리 규격 창의 "분할 및 학습률에 대한 다중 적합" 옵션을 사용하여 여러 모형을 적합시키는 경우를 가정해 보겠습니다. 그러면 "전체 통계량" 및 "누적 검증" 보고서에 결과가 표시되는 모형은 검증 데이터 집합의 엔트로피 R² 값(범주형 반응의 경우) 또는 R² 값(연속형 반응의 경우)이 가장 큰 모형입니다.

Image shown here측도 보고서

(범주형 반응에만 사용 가능) 훈련 데이터 집합과 검증 및 테스트 데이터 집합(지정된 경우)에 대한 다음 통계량을 제공합니다.

참고: 엔트로피 R² 및 일반화 R²의 경우 값이 1에 가까울수록 더 나은 적합을 나타냅니다. 평균 -Log p, RASE, 평균 절대 편차 및 오분류 비율의 경우 값이 작을수록 더 나은 적합을 나타냅니다.

엔트로피 R²

적합 모형과 상수 확률 모형의 로그 가능도를 비교하는 적합 측도입니다. 값 범위는 0에서 1 사이입니다. 자세한 내용은 엔트로피 R²에서 확인하십시오.

일반화 R²

일반 회귀 모형에 적용할 수 있는 측도입니다. 이 값은 가능도 함수 L을 기반으로 하며 최대값이 1이 되도록 척도화됩니다. 값이 1이면 완벽한 모형을 나타내고 0이면 상수 모형과 같음을 나타냅니다. 일반화 R² 측도는 표준 최소 제곱 설정 시 연속형 정규 반응에 대한 기존 R²으로 단순화됩니다. 일반화 R²을 Nagelkerke 또는 Craig와 Uhler R2이라고도 하는데, 이는 Cox-Snell 유사 R2을 정규화한 것입니다.

평균 -Log P

음의 log(p)의 평균입니다. 여기서 p는 발생한 사건과 연관된 적합 확률입니다.

RASE

제곱근 평균 제곱 예측 오차입니다. 차이는 1에서 p(실제로 발생한 반응 수준의 적합 확률) 사이입니다.

평균 절대 편차

반응과 예측 반응 사이의 차이에 대한 절대값의 평균입니다. 차이는 1에서 p(실제로 발생한 반응 수준의 적합 확률) 사이입니다.

오분류 비율

적합 확률이 가장 높은 반응 범주가 관측된 범주가 아닌 비율입니다.

N

관측값 수입니다.

Image shown here혼동 행렬 보고서

(범주형 반응에만 사용 가능) 훈련 데이터 집합과 검증 및 테스트 데이터 집합(지정된 경우)에 대한 분류 통계량을 표시합니다. "혼동 행렬" 보고서에는 혼동 행렬과 혼동 비율 행렬이 포함됩니다. 혼동 행렬은 실제 반응과 예측 반응의 이원 분류입니다. 혼동 비율 행렬은 값을 행 합계로 나눈 혼동 행렬과 동일합니다.

Image shown here결정 행렬

(범주형 반응을 사용하고 반응에 "수익 행렬" 열 특성이 있거나 "수익 행렬 지정" 옵션을 사용하여 비용을 지정하는 경우에만 사용 가능) 훈련 데이터 집합과 검증 및 테스트 데이터 집합(지정된 경우)에 대한 결정 개수 및 결정 비율 행렬을 제공합니다. 자세한 내용은 파티션 플랫폼의 추가 예에서 확인하십시오.

더 많은 정보를 원하십니까? 질문이 있습니까? JMP 사용자 커뮤니티에서 답변 받기 (community.jmp.com).