신경망 플랫폼은 적합 루틴에 검증 방법을 사용합니다. 검증 방법 선택에는 홀드백, K 폴드 또는 검증 열 사용(JMP Pro)이 포함됩니다. 신경망 플랫폼에서는 다음을 수행하여 모형을 적합시킵니다.
• 모형 모수에 벌점 적용
• 검증 데이터 집합을 사용하여 모수에 대한 벌점 조정
다음 검증 방법 중 하나를 선택합니다.
제외된 행 홀드백
행 상태를 사용하여 데이터의 부분집합을 생성합니다. 제외되지 않은 행은 훈련 데이터 집합으로 사용되고 제외된 행은 검증 데이터 집합으로 사용됩니다.
행 상태 사용 및 행 제외 방법에 대한 자세한 내용은 데이터 테이블에서 행 숨기고 제외하기의 JMP 사용에서 확인하십시오.
홀드백
원래 데이터를 무작위로 훈련 데이터 집합과 검증 데이터 집합으로 나눕니다. 원래 데이터에서 검증 데이터 집합으로 사용할 비율을 지정합니다(홀드백). 랜덤 선택은 단순 랜덤 표집을 기반으로 할 때보다 더 균형 있는 훈련 데이터 집합 및 검증 데이터 집합을 생성하기 위해 모형 요인에 대한 층화 표집을 기반으로 합니다.
K 폴드
데이터를 K개의 부분집합 또는 폴드로 나눕니다. 그러면 K개의 모형 전체를 적합시킬 때 K개의 폴드 각각이 나머지 데이터에 대한 모형 적합을 검증하는 데 사용됩니다. 최종 모형은 최량 검증 통계량을 제공하는 모형을 생성한 폴드에 대한 모형입니다.
이 방법은 제한된 양의 데이터를 효율적으로 사용하기 때문에 소규모 데이터 집합에 유용합니다.
검증 열
검증 데이터 집합을 정의하는 숫자 열을 사용합니다. 다음과 같이 열의 값에 따라 데이터 분할 방법이 결정됩니다.
– 검증 열에 두 개의 수준이 있는 경우 더 작은 값이 훈련 데이터 집합을 정의하고 더 큰 값이 검증 데이터 집합을 정의합니다.
– 검증 열에 세 개의 수준이 있는 경우 작은 값부터 순서대로 훈련 데이터 집합, 검증 데이터 집합, 테스트 데이터 집합을 각각 정의합니다.
– 검증 열에 4개 이상의 고유 값이 있는 경우 K 폴드 검증이 수행됩니다. 폴드 수는 검증 열의 값 수에 따라 결정됩니다.
신경망 플랫폼에서는 검증 열을 사용하여 모형을 훈련 및 조정하거나 모형을 훈련, 조정 및 평가합니다. 검증에 대한 자세한 내용은 JMP 모델링의 검증에서 확인하십시오.