선형 모형 적합 > 단계별 회귀 모형 > 단계별 회귀의 검증 옵션 > 단계별 회귀에서 두 개 또는 세 개의 값이 있는 검증 데이터 집합
발행일 : 03/10/2025

단계별 회귀에서 두 개 또는 세 개의 값이 있는 검증 데이터 집합

Image shown here두 개 또는 세 개의 값이 있는 검증 열을 지정하는 경우 단계별 분석법은 훈련 데이터 집합을 기반으로 모형을 적합시킵니다. 검증 데이터 집합 및 테스트 데이터 집합에 대한 모형 적합 통계량이 보고됩니다. 이러한 통계량이 정의되는 방식에 대한 자세한 내용은 검증 및 테스트 데이터 집합 통계량 정의에서 확인하십시오.

반응이 연속형인 경우 다음 통계량이 "단계별 회귀 제어" 패널에 나타납니다.

검증 R²("단계 기록" 보고서에도 표시됨)

RASE 검증

테스트 R²(테스트 데이터 집합이 있는 경우)

RASE 테스트(테스트 데이터 집합이 있는 경우)

반응이 이항 명목형 또는 순서형인 경우 다음 통계량이 "단계별 회귀 제어" 패널에 나타납니다.

검증 R²("단계 기록" 보고서에도 표시됨)

검증 평균 로그 오차

테스트 R²(테스트 데이터 집합이 있는 경우)

테스트 평균 로그 오차(테스트 데이터 집합이 있는 경우)

최대 검증 R²

모형 적합 창에서 두 개 또는 세 개의 값이 있는 검증 열을 지정하는 경우 "중지 규칙"은 기본적으로 "최대 검증 R²"으로 설정됩니다. 이 규칙은 검증 데이터 집합에 대해 R² 통계량을 최대화하는 모형을 찾습니다. "전진 선택" 또는 "후진 제거"로 설정된 방향과 함께 이 규칙을 적용할 수 있습니다.

참고: 최대 검증 R²은 p 값에 따른 입력(전진 선택 방향) 또는 제거(후진 제거 방향)로 정의된 모형만 고려합니다. 이 규칙은 모든 가능 모형을 고려하지 않습니다.

"단계" 버튼을 사용하여 항을 하나씩 입력하거나(전진 선택 방향) 하나씩 제거할 수 있습니다(후진 제거 방향). 언제든지 "단계 기록" 보고서의 "검증 R²" 오른쪽에 있는 버튼을 클릭하여 모형을 선택할 수 있습니다. 선택한 모형 항은 "현재 추정값" 보고서에서 업데이트됩니다. "모형 생성" 또는 "모형 실행"을 클릭하면 이 모형이 사용됩니다.

전진 선택 방향

전진 선택 방향을 사용하는 경우 단계별 회귀는 가장 작은 다음 p 값을 기준으로 항을 추가하여 연속 모형을 생성합니다.

"단계" 대신 "시작"을 클릭하면 항 입력 프로세스가 자동으로 진행됩니다. 적합 모형 중 최적으로 간주되는 모형이 마지막에 나열됩니다. 이 모형은 검증 R²의 국소적 감소를 무시하여 얻습니다. 특히 검증 R²이 가장 큰 모형이며, 검증 R² 값이 더 작은 모형이 10개까지 있을 수 있습니다. 이 모형은 "모수" 열의 "최선" 항과 "작업" 열의 "특정" 항으로 지정됩니다. "검증 R²" 오른쪽의 버튼을 클릭하면 이 최적 모형이 선택되지만 선택을 변경해도 됩니다.

후진 제거 방향

후진 제거 방향을 사용하는 경우 단계별 회귀는 가장 큰 다음 p 값을 기준으로 항을 제거하여 연속 모형을 생성합니다.

"후진 제거" 방향을 사용하려면 먼저 "모두 입력"을 클릭하여 모든 항을 모형에 입력해야 합니다. 후진 제거 방향은 전진 선택 방향과 비슷한 방식으로 작동합니다. "단계" 대신 "시작"을 클릭하면 항 제거 프로세스가 자동으로 진행됩니다. 최적 모형은 검증 R²이 가장 큰 모형이며, 검증 R² 값이 더 작은 모형이 10개까지 있을 수 있습니다.

검증 및 테스트 데이터 집합 통계량 정의

이 섹션에는 검증 R² 및 RASE 검증이 정의되어 있습니다. 테스트 R² 및 RASE 테스트는 테스트 데이터 집합에 대해 완전히 유사한 방식으로 계산됩니다.

연속형 반응

검증 R²

검증 데이터 집합에 대한 R² 측도이며 다음과 같이 계산됩니다.

검증 데이터 집합의 각 관측값에 대해 예측 오차를 계산합니다. 이 값은 실제 반응과 훈련 데이터 집합 모형에서 예측한 반응 간의 차이입니다.

예측 오차의 제곱합을 계산하여 SSEValidation을 구합니다.

검증 데이터 집합의 실제 반응과 평균 간의 차이에 대한 제곱합을 계산합니다. 이 값이 SSTValidation입니다.

검증 R²은 다음과 같습니다.

Equation shown here

참고: 검증 R²은 음수일 수 있습니다.

RASE 검증

검증 데이터 집합에 대한 평균 제곱 예측 오차의 제곱근입니다. 이 값은 다음과 같이 계산됩니다.

검증 데이터 집합의 각 관측값에 대해 예측 오차를 계산합니다. 이 값은 실제 반응과 훈련 데이터 집합 모형에서 예측한 반응 간의 차이입니다.

예측 오차의 제곱합을 계산하여 SSEValidation을 구합니다.

검증 데이터 집합의 관측값 수를 nValidation으로 나타냅니다.

RASE 검증은 다음과 같습니다.

Equation shown here

이항 명목형 또는 순서형 반응

검증 R²

검증 데이터 집합에 대한 엔트로피 R² 측도(McFadden R2이라고도 함)이며 다음과 같이 계산됩니다.

훈련 데이터 집합을 사용하여 모형이 적합됩니다.

모든 관측값에 대한 예측 확률을 구합니다.

훈련 데이터 집합 모형에 기반한 예측 확률을 사용하여 검증 데이터 집합의 관측값에 대해 모형의 가능도가 계산됩니다. 이 통계량을 Likelihood_FullValidation이라고 합니다.

검증 데이터 집합의 데이터를 사용하여 축소 모형(예측 변수 없음)의 가능도가 계산됩니다. 이 통계량을 Likelihood_ReducedValidation이라고 합니다.

검증 R²은 다음과 같습니다.

Equation shown here

참고: 검증 R²은 음수일 수 있습니다.

검증 평균 로그 오차

검증 데이터 집합의 평균 로그 오차는 다음과 같이 계산됩니다.

검증 데이터 집합의 각 관측값에 대해 훈련 데이터 집합에 기반한 모형에 의해 결정된 예측 확률의 로그를 계산합니다.

이 로그의 합을 검증 데이터 집합의 관측값 수로 나눈 후 결과 값의 음수를 구합니다.

팁: 검증 평균 로그 오차 값이 작을수록 좋습니다.

더 많은 정보를 원하십니까? 질문이 있습니까? JMP 사용자 커뮤니티에서 답변 받기 (community.jmp.com).