부스티드 트리 플랫폼 시작분석 > 예측 모델링 > 부스티드 트리를 선택하여 부스티드 트리 플랫폼을 시작합니다.
그림 6.6 Body Fat.jmp를 사용한 부스티드 트리 시작 창
"열 선택"의 빨간색 삼각형 메뉴에 포함된 옵션에 대한 자세한 내용은 열 필터 메뉴의 JMP 사용에서 확인하십시오.
부스티드 트리 플랫폼 시작 창에는 다음과 같은 옵션이 있습니다.
Y, 반응
분석할 하나 이상의 반응 변수입니다.
X, 요인
예측 변수입니다.
가중치
분석의 각 행에 가중치를 할당하는 숫자 값이 포함된 열입니다.
빈도
분석의 각 행에 빈도를 할당하는 숫자 값이 포함된 열입니다.
검증
검증 데이터 집합을 정의하는 숫자 열입니다. 이 열에는 최대 세 개의 구분되는 값이 포함되어야 합니다.
– 검증 열에 두 개의 수준이 있는 경우 더 작은 값이 훈련 데이터 집합을 정의하고 더 큰 값이 검증 데이터 집합을 정의합니다.
– 검증 열에 세 개의 수준이 있는 경우 작은 값부터 순서대로 훈련 데이터 집합, 검증 데이터 집합, 테스트 데이터 집합을 각각 정의합니다.
– 검증 열에 네 개 이상의 수준이 있는 경우 가장 작은 세 개의 값을 포함하는 행이 검증 데이터 집합을 정의합니다. 다른 모든 행은 분석에서 제외됩니다.
부스티드 트리 플랫폼에서는 검증 열을 사용하여 모형을 훈련 및 조정하거나 모형을 훈련, 조정 및 평가합니다. 검증에 대한 자세한 내용은 JMP 모델링의 검증에서 확인하십시오.
"열 선택" 목록에서 아무 열도 선택하지 않은 상태로 "검증" 버튼을 클릭하면 데이터 테이블에 검증 열을 추가할 수 있습니다. "검증 열 생성" 유틸리티에 대한 자세한 내용은 검증 열 생성에서 확인하십시오.
기준
개별 분석을 정의하는 수준이 포함된 하나 이상의 열입니다. 지정된 열의 각 수준에 대해 해당 행은 사용자가 지정한 다른 변수를 사용하여 분석됩니다. 결과는 개별 보고서에 제공됩니다. 기준 변수가 둘 이상 할당되면 기준 변수의 가능한 각 수준 조합에 대해 개별 보고서가 생성됩니다.
방법
분할 방법(의사 결정 나무, 붓스트랩 포레스트, 부스티드 트리, K 최근접 이웃 또는 나이브 베이즈)을 선택할 수 있습니다. 의사 결정 나무를 제외한 이 대체 방법은 JMP Pro에서 사용할 수 있습니다.
이러한 방법에 대한 자세한 내용은 파티션 모형, 붓스트랩 포레스트, K 최근접 이웃 및 나이브 베이즈에서 확인하십시오.
검증 데이터 비율
검증 데이터 집합으로 사용할 데이터 비율입니다.
결측값 정보화
이 옵션을 선택하면 범주형 예측 변수에 대한 결측값 범주화 및 연속형 예측 변수에 대한 결측값 정보화 처리가 활성화됩니다. 자세한 내용은 ROC 곡선에서 확인하십시오.
순서형의 순서를 지킴
이 옵션을 선택하면 순서를 유지하는 분할만 고려하도록 제한됩니다.