업리프트 모형업리프트 모형은 파티션 모형의 한 유형입니다. 모형 그래프의 세로 축은 모형 분할의 관측값 비율을 나타냅니다. 가로 축은 노드별로 배열된 관측값에 해당합니다. 각 노드의 검은색 가로선은 평균 반응을 표시합니다. 각 분할 내에는 빨간색 또는 파란색 선으로 표시된 처리의 하위 분할이 있습니다. 이 선은 분할 내의 두 처리 그룹 각각에 대한 평균 반응을 나타냅니다. 처리 열의 값 순서화에 따라 이러한 선의 배치 순서가 결정됩니다. 노드가 분할되면 그래프가 업데이트되어 가로 축 아래에 분할이 표시됩니다. 세로선은 분할을 구분합니다.
그래프 아래에 분할, 가지 치기 및 시작 컨트롤 버튼이 있습니다. "시작" 버튼은 검증 데이터 집합이 있는 경우에만 나타납니다. 또한 처리 열의 이름과 두 수준(처리1, 처리2)이 표시됩니다. 처리 열에 세 개 이상의 수준이 지정된 경우 첫 번째 수준을 제외한 모든 수준이 단일 수준으로 간주되어 처리2로 결합됩니다.
처리 열 정보 오른쪽에는 예측과 관련된 요약 값을 보여 주는 보고서가 있습니다. 업리프트 모델링에서는 예측이 목적이 아닙니다. 분할이 발생하면 보고서가 업데이트됩니다. 검증 데이터 집합을 사용하는 경우 훈련 데이터 집합과 검증 데이터 집합에 대한 값이 모두 표시됩니다.
R²
트리와 연관된 회귀 모형의 R²입니다. 회귀 모형에는 처리 열과의 교호작용이 포함됩니다. R²이 1에 가까울수록 R²이 0에 가까울 때보다 데이터에 더 잘 적합된다는 것을 나타냅니다.
참고: R² 값이 낮으면 설명되지 않은 변동을 설명하는 변수가 모형에 없는 것일 수 있습니다. 하지만 데이터의 내재 변동 범위가 큰 경우에는 유용한 업리프트 모형이라도 R² 값이 낮을 수 있습니다.
RMSE
트리와 연관된 회귀 모형의 RMSE(제곱근 평균 제곱 오차)입니다. RMSE는 연속형 반응에만 제공됩니다. 자세한 내용은 선형 모형 적합에서 확인하십시오.
N
관측값 수입니다.
분할 수
분할 발생 횟수입니다.
AICc
연관된 회귀 모형을 사용하여 계산되는 AICc(수정 Akaike 정보 기준)입니다. AICc는 연속형 반응에만 제공됩니다. 자세한 내용은 선형 모형 적합의 “Likelihood, AICc, and BIC”에서 확인하십시오.
업리프트 의사 결정 나무의사 결정 나무에는 업리프트 모델링에 사용된 분할이 있는 분할 트리가 표시됩니다. Hair Care Product.jmp 샘플 데이터 테이블을 사용한 예는 Figure 6.5에서 확인하십시오. 각 노드에는 다음과 같은 정보가 포함됩니다.
처리
처리 열의 이름과 두 수준이 표시됩니다.
비율
(반응이 2수준 범주형인 경우에만 표시됨) 각 처리 수준에 대해 이 노드에서 응답한 개체의 비율입니다.
평균
(반응이 연속형인 경우에만 표시됨) 각 처리 수준에 대해 이 노드의 개체에 대한 평균 반응입니다.
개수
지정된 처리 수준에서 이 노드의 개체 수입니다.
t 비
이 노드의 개체에 대한 처리 수준 전체에서 반응 차이 검정에 사용할 t 비입니다. 반응이 범주형인 경우 이 검정에서 연속형(값 0, 1)으로 처리됩니다.
처리 차이
전체 처리 수준에 대해 반응 평균의 차이입니다. 이 값은 다음과 같이 가정할 때 업리프트(상승)입니다.
– 처리 열의 값 순서화에서 첫 번째 수준이 처리를 나타냅니다.
– 값이 클수록 영향이 크다는 것을 반영하도록 반응이 정의됩니다.
LogWorth
지정된 노드에 기반한 후속 분할의 LogWorth 값입니다.
그림 6.5 첫 번째 분할의 노드
각 노드에는 다음과 같은 추가 정보를 제공하는 "후보" 보고서도 포함되어 있습니다.
항
모형 항입니다.
LogWorth
지정된 항의 가능한 모든 분할에 대한 최대 LogWorth입니다. 분할에 해당하는 LogWorth는 수정 p 값의 -log10입니다.
F 비
연속형 반응의 경우 선형 회귀 모형의 교호작용 항과 연관된 F 비입니다. 회귀 모형은 반응을 처리, 이항 분할 및 분할*처리 교호작용의 선형 함수로 지정합니다. 범주형 반응의 경우 명목형 로지스틱 모형의 교호작용 항에 대한 카이제곱 값입니다.
감마
연속형 반응의 경우 F 비 계산에 사용된 선형 회귀 모형의 교호작용 항 계수입니다. 범주형 반응의 경우 Firth 수정 로그 승산비에서 생성된 교호작용의 추정값입니다.
절단점
연속형 항의 경우 분할을 정의하는 점입니다. 범주형 항의 경우 첫 번째(왼쪽) 노드를 설명합니다.