예측 및 전문 모델링 > 파티션 모형 > 파티션 플랫폼 개요
발행일 : 03/10/2025

파티션 플랫폼 개요

파티션 플랫폼에서는 예측 변수와 반응 값 사이의 관계에 따라 데이터를 재귀적으로 분할하여 의사 결정 나무를 생성합니다. 분할은 의사 결정 나무, CARTTM, CHAIDTM, C4.5, C5 등 다양한 이름 및 브랜드 이름에 따라 몇 가지 변형이 있습니다. 이 기법은 다음과 같은 이유 때문에 데이터 마이닝 기법으로 간주되는 경우가 많습니다.

적합한 사전 모형 없이 관계를 탐색하는 데 유용합니다.

많은 문제를 쉽게 처리합니다.

결과를 해석할 수 있습니다.

분할이 적용되는 대표적인 예는 질병에 대한 진단 휴리스틱을 만드는 것입니다. 여러 피실험자의 증상과 결과가 주어졌을 때 분할을 사용하여 새 환자를 진단하는 데 도움이 되는 질문 계층을 생성할 수 있습니다.

예측 변수는 연속형 또는 범주형(명목형 또는 순서형)일 수 있습니다. 예측 변수가 연속형이면 절단 값에 의해 분할이 생성됩니다. 표본은 이 절단 값보다 작은 값과 큰 값으로 구분됩니다. 예측 변수가 범주형이면 표본이 두 그룹의 수준으로 구분됩니다.

반응도 연속형 또는 범주형(명목형 또는 순서형)일 수 있습니다. 반응이 연속형이면 회귀 트리로 간주됩니다. 플랫폼에서 반응 값의 평균을 적합시키고, 오차 제곱합을 최소화하는 분할이 선택됩니다. 반응이 범주형이면 분류 트리로 간주됩니다. 적합된 값은 반응 수준에 대한 확률이며, 잔차 로그 가능도 카이제곱을 최소화하는 분할이 선택됩니다.

분할 기준에 대한 자세한 내용은 파티션 플랫폼에 대한 통계 상세 정보에서 확인하십시오.

재귀 분할에 대한 자세한 내용은 Hawkins and Kass(1982) 및 Kass(1980) 연구 자료에서 확인하십시오.

더 많은 정보를 원하십니까? 질문이 있습니까? JMP 사용자 커뮤니티에서 답변 받기 (community.jmp.com).