파티션 플랫폼의 "결측값 정보화" 옵션을 사용하면 예측 변수의 결측값을 정보로 처리할 수 있습니다. 적합 모형은 결정적 모형입니다. "결측값 정보화" 옵션은 시작 창에 있으며 기본적으로 선택되어 있습니다. "결측값 정보화" 옵션을 선택하면 범주형 예측 변수와 연속형 예측 변수가 다르게 처리됩니다.
• 범주형 예측 변수의 결측값을 포함하는 행은 해당 변수에 대한 별도의 수준으로 분석에 포함됩니다.
• 연속형 예측 변수의 결측값을 포함하는 행은 다음과 같이 분할에 할당됩니다. 연속형 예측 변수의 값이 정렬됩니다. 먼저 결측 행이 정렬된 값의 아래쪽 끝에 있다고 간주됩니다. 모든 분할이 생성됩니다. 그런 다음 결측 행이 정렬된 값의 위쪽 끝에 있다고 간주됩니다. 다시 모든 분할이 생성됩니다. 최적 분할은 LogWorth 기준을 사용하여 결정됩니다. 지정된 예측 변수에 대해 추가 분할을 수행하는 경우 알고리즘은 해당 예측 변수에 의해 유도된 첫 번째 분할에 따라 결측 행을 높은 값 또는 낮은 값으로 커밋합니다.
"결측값 정보화" 옵션을 선택하지 않으면 결측값이 다음과 같이 처리됩니다.
• 결측값이 있는 예측 변수가 분할 변수로 사용되면 해당 예측 변수에 대한 결측값이 있는 각 행이 분할의 양쪽 중 하나에 랜덤 할당됩니다.
• 결측값이 있는 예측 변수가 분할 변수로 처음 사용되면 결측값 대치 열이 요약 보고서에 추가되어 결측값 대치 수를 표시합니다. 결측값 대치가 추가로 발생하면 결측값 대치 열이 업데이트됩니다(). 여기서는 결측값 대치가 5번 수행되었습니다.
참고: 결측값 대치 수는 결측값이 포함된 행 수보다 클 수 있습니다. 결측값 대치는 각 분할에서 발생합니다. 결측값이 있는 행은 여러 번 랜덤 할당될 수 있습니다. 행이 랜덤 할당될 때마다 결측값 대치 수가 증가합니다.