발행일 : 03/10/2025

파티션 검증

파티션 모형이 쉽게 과대적합된다는 점에서 파티션 모형과 함께 검증을 사용하는 것은 중요합니다. 이 경우 모형은 모형을 생성하는 데 사용된 데이터를 매우 잘 예측하지만 미래 관측값은 제대로 예측하지 못합니다. 검증은 데이터 집합의 일부를 사용하여 모형 모수를 추정하고 다른 부분을 사용하여 모형의 예측 능력을 평가하는 프로세스입니다. 검증에 대한 자세한 내용은 JMP 모델링의 검증에서 확인하십시오.

파티션에서 검증 방법을 사용할 때 시작 버튼이 나타납니다. 시작 버튼을 사용하면 분할 버튼을 반복해서 클릭하지 않아도 분할을 반복할 수 있습니다. 시작 버튼을 클릭하면 검증 R²이 다음 10개 분할을 통해 얻을 수 있는 값보다 나을 때까지 계속 분할합니다. 이 규칙은 해석하기 어렵지만 예측 검정력이 좋은 복잡한 트리를 생성할 수 있습니다.

시작 버튼을 사용하면 분할 기록 명령이 설정됩니다. 시작 버튼을 사용하여 생성된 트리의 노드가 40개를 초과하는 경우 트리 표시 명령이 해제됩니다.

다음 검증 방법 중 하나를 선택합니다.

제외된 행

행 상태를 사용하여 데이터의 부분집합을 생성합니다. 제외되지 않은 행은 훈련 데이터 집합으로 사용되고 제외된 행은 검증 데이터 집합으로 사용됩니다.

행 상태 사용 및 행 제외 방법에 대한 자세한 내용은 데이터 테이블에서 행 숨기고 제외하기JMP 사용에서 확인하십시오.

홀드백

원래 데이터를 무작위로 훈련 데이터 집합과 검증 데이터 집합으로 나눕니다. 플랫폼 시작 창의 검증 데이터 비율은 검증 데이터 집합으로 사용할 원래 데이터의 비율을 지정하는 데 사용됩니다(홀드백). 검증 데이터 비율에 대한 자세한 내용은 파티션 플랫폼 시작에서 확인하십시오.

Image shown here검증 열

검증 데이터 집합을 정의하는 숫자 열을 사용합니다. 이 열에는 최대 세 개의 구분되는 값이 포함되어야 합니다.

검증 열에 두 개의 수준이 있는 경우 더 작은 값이 훈련 데이터 집합을 정의하고 더 큰 값이 검증 데이터 집합을 정의합니다.

검증 열에 세 개의 수준이 있는 경우 작은 값부터 순서대로 훈련 데이터 집합, 검증 데이터 집합, 테스트 데이터 집합을 각각 정의합니다.

검증 열에 네 개 이상의 수준이 있는 경우 가장 작은 세 개의 값을 포함하는 행이 검증 데이터 집합을 정의합니다. 다른 모든 행은 분석에서 제외됩니다.

"열 선택" 목록에서 아무 열도 선택하지 않은 상태로 "검증" 버튼을 클릭하면 데이터 테이블에 검증 열을 추가할 수 있습니다. "검증 열 생성" 유틸리티에 대한 자세한 내용은 검증 열 생성에서 확인하십시오.

팁: K 폴드 또는 내포 K 폴드 교차 검증을 사용하려면 모형 선별 플랫폼을 통해 파티션 모형을 적합시킵니다. 자세한 내용은 모형 선별에서 확인하십시오.

더 많은 정보를 원하십니까? 질문이 있습니까? JMP 사용자 커뮤니티에서 답변 받기 (community.jmp.com).