발행일 : 03/10/2025

Image shown here트리별 요약

붓스트랩 포레스트 플랫폼의 "트리별 요약" 보고서에는 In-Bag 및 Out-Of-Bag 관측값에 대한 개념이 포함됩니다. 개별 트리의 경우 트리를 적합시키는 데 사용되는 관측값의 붓스트랩 표본은 복원 추출됩니다. 관측값이 복원 추출되므로 관측값의 100%를 표집하도록 지정해도 사용되지 않은 관측값의 기대 비율은 1/e입니다. 각 개별 트리에 대해 사용되지 않은 관측값을 Out-Of-Bag 관측값이라고 합니다. 트리를 적합시키는 데 사용된 관측값은 In-Bag 관측값이라고 합니다. 요약을 사용하여 표집 방법이 트리에 미치는 영향을 평가할 수 있습니다. 요약 값은 개별 트리 간에 유사할 것으로 예상됩니다.

"트리별 요약" 보고서에는 각 트리에 대해 다음과 같은 요약 통계량이 표시됩니다.

분할

의사 결정 나무의 분할 수입니다.

순위

트리의 OOB 손실/N 순위입니다(오름차순). OOB 손실/N이 가장 작은 트리의 순위가 1입니다.

OOB 손실

트리 가지 치기 전에 Out Of Bag 행에 적용될 경우 트리의 예측 부정확성을 나타내는 측도입니다. 트리는 지정된 최대 크기에 도달하거나 중지 기준으로 더 이상 개선되지 않을 때까지 계속 분할됩니다. 중지 기준으로 더 이상 개선되지 않아 분할이 중지되면 한 수준 뒤로 트리 가지 치기를 수행하여 최종 트리를 얻습니다. 값이 작을수록 예측 정확도가 높다는 것을 나타냅니다.

OOB 손실/N

OOB 손실을 OOB 행 수, 즉 OOB N으로 나눈 값입니다.

(연속형 반응에만 사용 가능) 트리의 R² 값입니다.

IB SSE

(연속형 반응에만 사용 가능) In Bag 행에 대한 오차 제곱합입니다.

IB SSE/N

(연속형 반응에만 사용 가능) In Bag 행에 대한 오차 제곱합을 In Bag 관측값 수로 나눈 값입니다. In Bag 관측값 수는 훈련 데이터 집합의 관측값 수에 "붓스트랩 포레스트 규격" 창에 지정한 붓스트랩 표집 비율을 곱한 값과 같습니다.

OOB N

(연속형 반응에만 사용 가능) Out Of Bag 행 수입니다.

OOB SSE

(연속형 반응에만 사용 가능) 최종 트리를 Out Of Bag 행에 적용했을 때 오차 제곱합입니다.

OOB SSE/N

(연속형 반응에만 사용 가능) OOB SSE를 OOB 행 수, 즉 OOB N으로 나눈 값입니다.

더 많은 정보를 원하십니까? 질문이 있습니까? JMP 사용자 커뮤니티에서 답변 받기 (community.jmp.com).