발행일 : 03/10/2025

Image shown here규격 창

"부스티드 트리" 시작 창에서 "확인"을 선택하면 "그래디언트 부스티드 트리 규격" 창이 나타납니다.

그림 6.7 부스티드 트리 규격 창 

Boosted Tree Specification Window

Image shown here부스트 패널

계층 수

최종 트리에 포함할 최대 계층 수입니다.

트리당 분할 수

각 계층의 분할 수입니다.

학습률

0 < r £ 1의 숫자입니다. 학습률이 1에 가까우면 최종 트리에 대한 수렴이 빨라지지만 데이터가 과대적합되는 경향도 높습니다. 적은 수의 계층이 지정된 경우 1에 가까운 학습률을 사용하십시오. 학습률은 모형의 수렴을 늦추는 작은 소수이며 보통 0.01에서 0.1 사이입니다. 이렇게 하면 이후 계층이 이전 계층과 다른 분할을 사용할 수 있도록 합니다.

과대적합 벌점

(범주형 반응에만 사용 가능) 적합 확률이 0이 되지 않도록 하는 데 도움이 되는 편향 모수입니다. 자세한 내용은 과대적합 벌점에 대한 통계 상세 정보에서 확인하십시오.

최소 크기 분할

후보 분할에 필요한 최소 관측값 수입니다.

Image shown here다중 적합 패널

분할 및 학습률에 대한 다중 적합

이 옵션을 선택하면 트리당 분할 수(정수 증분)와 학습률(0.1 증분)의 모든 조합에 대한 부스티드 트리가 생성됩니다.

조합의 하한은 "트리당 분할 수" 및 "학습률" 옵션으로 지정됩니다. 조합의 상한은 다음 옵션으로 지정됩니다.

트리당 최대 분할 수

트리당 분할 수의 상한입니다.

최대 학습률

학습률의 하한입니다.

설계 조정 테이블 사용

일부 조정 모수의 값이 포함된 데이터 테이블(설계 조정 테이블)을 선택할 수 있는 창을 엽니다. 설계 조정 테이블에는 지정할 각 옵션에 대한 열과 각각 단일 부스티드 트리 모형 설계를 나타내는 하나 이상의 행이 있습니다. 설계 조정 테이블에 옵션이 지정되지 않으면 기본값이 사용됩니다.

JMP에서는 지정된 조정 모수를 사용하여 테이블의 각 행에 대해 부스티드 트리 모형을 생성합니다. 설계 조정 테이블에 둘 이상의 모형이 지정된 경우 "모형 검증 집합 요약" 보고서에 각 모형의 R² 값이 나열됩니다. "부스티드 트리" 보고서에는 R² 값이 가장 큰 모형의 적합 통계량이 표시됩니다.

실험 설계 기능을 사용하여 설계 조정 테이블을 생성할 수 있습니다. 예를 들면 사용자 설계 또는 공간 채움 설계를 사용합니다. 자세한 내용은 붓스트랩 포레스트 플랫폼의 추가 예에서 확인하십시오. 부스티드 트리 설계 조정 테이블에는 다음 열이 임의의 순서로 포함될 수 있습니다.

계층 수

트리당 분할 수

학습률

최소 크기 분할

행 표집 비율

열 표집 비율

Image shown hereStochastic 부스트 패널

행 표집 비율

각 계층에 대해 표집할 훈련 행의 비율입니다.

참고: 반응이 범주형이면 층별 랜덤 표집을 사용하여 훈련 행이 표집됩니다.

열 표집 비율

각 계층에 대해 표집할 예측 변수 열의 비율입니다.

Image shown here재현성 패널

멀티스레딩 제한

이 옵션을 선택하면 모든 계산이 단일 스레드에서 수행됩니다.

난수 시드값

이후 플랫폼 실행을 위해 결과를 재현하는 데 사용할 0이 아닌 숫자 난수 시드값을 지정합니다. 기본적으로 난수 시드값은 0으로 설정되어 재현 가능한 결과를 생성하지 않습니다. 분석을 스크립트에 저장하면 사용자가 입력한 난수 시드값이 스크립트에 저장됩니다.

Image shown here조기 중지

조기 중지

이 옵션을 선택하면 계층을 추가해도 검증 통계량이 개선되지 않을 경우 부스트 프로세스에서 추가 계층 적합을 중지합니다. 이 옵션을 선택하지 않으면 지정된 계층 수에 도달할 때까지 부스트 프로세스가 계속됩니다. 이 옵션은 검증을 사용하는 경우에만 나타납니다.

더 많은 정보를 원하십니까? 질문이 있습니까? JMP 사용자 커뮤니티에서 답변 받기 (community.jmp.com).