발행일 : 03/10/2025

분할 기준에 대한 통계 상세 정보

파티션 플랫폼의 노드 분할은 노드에 대한 "후보" 보고서에 나오는 LogWorth 통계량을 기반으로 합니다. LogWorth는 다음과 같이 계산됩니다.

-log10(p 값)

여기서 조정 p 값은 분할이 발생할 수 있는 다양한 방법을 고려하는 복합적 형식으로 계산됩니다. 이 계산은 수준이 많은 X를 우선으로 하는 비조정 p 값 및 수준이 적은 X를 우선으로 하는 Bonferroni p 값에 비해 매우 공정합니다. 이 방법에 대한 자세한 내용은 Sall(2002) 연구 자료에서 확인하십시오.

연속형 반응의 경우 SS(제곱합)가 노드 보고서에 보고됩니다. 이 값은 분할로 인한 오차 제곱합의 변화입니다.

선택된 후보 SS는 다음과 같습니다.

SStest = SSparent - (SSright + SSleft) 여기서 노드의 SS는 s2(n - 1)입니다.

연속형 반응의 경우 차이 통계량도 보고됩니다. 이 값은 상위 노드의 두 하위 노드에 대한 예측값의 차이입니다.

범주형 반응의 경우 G2(가능도비 카이제곱)이 보고서에 나타납니다. 실제로 이 값은 [자연 로그] 엔트로피의 두 배 또는 엔트로피 변화의 두 배입니다. 엔트로피는 각 관측값에 대한 S -log(p)이며, 여기서 p는 발생한 반응에 기인한 확률입니다.

선택된 후보 G2은 다음과 같습니다.

G2 test = G2 parent - (G2 left + G2 right)

파티션에는 실제로 두 가지 비율이 있습니다. 하나는 훈련에 사용되는 일반적인 개수 대 합계 비율이며, 다른 하나는 0에서 약간 벗어난 비율입니다. 귀속 확률이 0이 아니므로 엔트로피 R²에 사용되는 검증 또는 제외된 데이터 집합에 대해 확률 로그를 계산할 수 있습니다.

더 많은 정보를 원하십니까? 질문이 있습니까? JMP 사용자 커뮤니티에서 답변 받기 (community.jmp.com).