발행일 : 03/10/2025

Image shown here검증 방법 옵션

다음 방법을 사용하여 일반화 회귀 모형 적합을 검증할 수 있습니다.

K 폴드

조정 모수의 각 값에 대해 다음 단계가 수행됩니다.

관측값이 k개의 부분집합 또는 폴드로 분할됩니다.

그러면 각 폴드가 검증 데이터 집합으로 사용됩니다. 모형은 폴드에 없는 관측값에 적합됩니다. 폴드에 있는 관측값에 대해 해당 모형에 기반한 로그 가능도가 계산되어 검증 로그 가능도를 제공합니다.

k 폴드에 대한 검증 로그 가능도의 평균이 계산됩니다. 이 값은 조정 모수 값에 대한 검증 로그 가능도로 사용됩니다.

최대 검증 로그 가능도를 갖는 조정 모수의 값은 최종 해를 생성하는 데 사용됩니다. 최종 모형을 생성하기 위해 조정 모수의 최적값에 대해 파생된 모든 k개 모형이 전체 데이터 집합에 적합됩니다. 이 중에서 검증 로그 가능도가 가장 높은 모형이 최종 모형으로 선택됩니다. 이 최종 모형에 사용된 훈련 데이터 집합이 훈련 데이터 집합으로 지정되고 이 모형의 홀드아웃 폴드가 검증 데이터 집합입니다. 이러한 훈련 데이터 집합과 검증 데이터 집합이 최종 해에 대해 보고된 결과 및 그림에 사용됩니다.

홀드백

검증 데이터 집합에 대해 지정된 비율의 데이터를 무작위로 선택하고 데이터의 다른 부분을 사용하여 모형을 적합시킵니다. 최종 해는 검증 데이터 집합에 대한 음의 로그 가능도를 최소화하는 값입니다. 이 방법은 큰 데이터 집합에 유용합니다. 랜덤 선택은 단순 랜덤 표집을 기반으로 할 때보다 더 균형 있는 훈련 데이터 집합 및 검증 데이터 집합을 생성하기 위해 모형 요인에 대한 층화 표집을 기반으로 합니다.

Leave-One-Out

leave-one-out 교차 검증을 수행합니다. 이 방법은 폴드 수가 행 수와 같은 K 폴드와 동등합니다. 중간 또는 큰 데이터 집합에는 이 옵션을 사용하면 안 됩니다. 심지어 중간 크기 정도의 관측값 수 일 때도 처리 시간이 오래 걸릴 수 있습니다. 최종 해에 대해 보고된 결과 및 그림에 사용되는 훈련 데이터 집합과 검증 데이터 집합(한 행)은 K 폴드 검증에 대해 수행된 대로 결정됩니다.

BIC

해 경로에서 BIC(베이지안 정보 기준)를 최소화합니다. 자세한 내용은 가능도, AICc 및 BIC에서 확인하십시오.

AICc

해 경로에서 수정 AICc(Akaike 정보 기준)를 최소화합니다. AICc는 검증 방법의 기본 설정입니다. 자세한 내용은 가능도, AICc 및 BIC에서 확인하십시오.

참고: 모수 수가 표본 크기에 근접하거나 초과하는 경우 AICc가 정의되지 않습니다.

ERIC

해 경로에서 ERIC(확장된 정규화 정보 기준)를 최소화합니다. 자세한 내용은 모형 적합 상세 정보에서 확인하십시오. 지수 계열 분포와 Lasso 회귀 및 적응형 Lasso 회귀 추정 방법에만 사용할 수 있습니다.

없음

검증을 사용하지 않습니다. 최대 가능도 추정 방법 및 분위수 회귀에만 사용할 수 있습니다.

검증 열

"모형 적합" 창에서 지정한 열을 "검증" 역할이 할당된 것으로 사용합니다. 최종 해는 검증 데이터 집합에 대한 음의 로그 가능도를 최소화하는 값입니다. Dantzig 선택기 추정 방법이 지정되거나 분위수 회귀 또는 Cox 비례 위험 분포가 지정된 경우에는 이 옵션을 사용할 수 없습니다.

참고: "분위수 회귀" 분포에는 "없음" 검증 방법 옵션만 허용됩니다. "최대 가능도" 추정 방법에는 "없음"과 "검증 열" 검증 방법만 허용됩니다. "Cox 비례 위험" 분포에는 "BIC", "AICc" 및 "없음" 검증 방법만 허용됩니다. "Dantzig 선택기" 추정 방법에는 "BIC"와 "AICc" 검증 방법만 허용됩니다. "SVEM 전진 선택" 또는 "SVEM Lasso" 추정 방법에는 "검증 방법" 옵션을 사용할 수 없습니다.

더 많은 정보를 원하십니까? 질문이 있습니까? JMP 사용자 커뮤니티에서 답변 받기 (community.jmp.com).