과대적합을 방지하고 양호한 예측 모형을 선택하기 위해 모델링 전에 데이터를 여러 데이터 집합으로 분할할 수 있습니다. 이 프로세스는 원래 데이터의 일부를 사용하여 모수를 추정하고 나머지 데이터를 사용하여 모수를 조정 또는 평가하거나 둘 다 수행합니다. JMP Pro에서는 다음과 같은 방법을 사용하여 데이터를 두 개 또는 세 개의 집합으로 분할할 수 있습니다.
훈련 및 평가
데이터를 훈련 데이터 집합과 검증 데이터 집합이라는 두 집합으로 분할합니다. 훈련 데이터 집합은 모형 모수를 추정하는 데 사용됩니다. 검증 데이터 집합은 적합 모형의 성능을 독립적으로 평가하는 데 사용됩니다.
훈련 및 조정
데이터를 훈련 데이터 집합과 검증 데이터 집합이라는 두 집합으로 분할합니다. 훈련 데이터 집합은 모형 모수를 추정하는 데 사용됩니다. 검증 데이터 집합은 모형 적합 알고리즘에서 모형 모수를 조정하고 궁극적으로 예측 능력이 양호한 모형을 선택하는 데 사용됩니다. 이 경우에는 독립적인 모형 평가가 수행되지 않습니다.
훈련, 조정 및 평가
데이터를 훈련 데이터 집합, 검증 데이터 집합, 테스트 데이터 집합이라는 세 집합으로 분할합니다. 훈련 데이터 집합은 모형 모수를 추정하는 데 사용됩니다. 검증 데이터 집합은 모형 적합 알고리즘에서 모형 모수를 조정하고 궁극적으로 예측 능력이 양호한 모형을 선택하는 데 사용됩니다. 그런 다음 테스트 데이터 집합을 사용하여 적합 모형의 성능을 독립적으로 평가합니다.