발행일 : 03/10/2025

자체 검증 앙상블 모형 개요

일반화 회귀 플랫폼에서는 전진 선택 또는 Lasso 회귀 모형에 적용되는 SVEM(자체 검증 앙상블 모델링) 방법을 사용할 수 있습니다. SVEM 방법은 훈련 데이터 집합과 검증 데이터 집합 모두에서 각 행에 0이 아닌 가중치가 부여되는 재표집 방법입니다. 특정 행에 대한 훈련 및 검증 가중치는 역상관관계를 가지므로 훈련 데이터 집합에 강한 영향을 미치는 행은 검증 데이터 집합에 약한 영향을 미치며, 그 반대도 마찬가지입니다. 이 방법은 설계된 실험의 결과를 분석하는 데 유용할 수 있습니다.

다음 단계에 따라 방법을 요약할 수 있습니다.

1. 설계 행렬의 복사본을 원래 행렬에 수직으로 추가합니다. 원래 설계 행렬에 n개의 행이 있으므로 새 설계 행렬에는 원래 설계 행렬과 같은 수의 열과 2n개의 행이 있습니다.

2. 반응 벡터의 복사본을 원래 벡터에 수직으로 추가합니다. 새 반응 벡터의 행 수는 원래 반응 벡터의 두 배입니다.

3. 위치 모수가 1인 지수 분포에서 n개의 난수 값을 생성합니다. 여기서 n은 원래 설계 행렬의 행 수입니다. 이는 설계 행렬의 처음 n개 행에 할당되는 가중치입니다.

4. 처음 n개의 난수 값과 역상관되는 n개의 난수 값을 생성합니다. 이는 설계 행렬의 마지막 n개 행에 할당되는 가중치입니다.

5. 전진 선택 또는 Lasso 회귀 모형을 생성된 훈련 데이터 집합과 검증 데이터 집합에 적합시켜 모수 추정값을 구합니다.

6. 각 개별 모형에 대해 step 3 ~ step 5를 반복합니다. 앙상블 모형의 개별 모형 수는 "모형 시작" 제어판의 "표본" 옵션을 사용하여 지정됩니다.

7. 개별 모형의 모수 추정값 평균을 구하여 앙상블 모형 모수 추정값을 생성합니다.

8. 앙상블 모형 모수 추정값을 사용하는 선형 예측 변수에 대한 원래 반응의 단순 선형 회귀를 수행하여 편향 제거 모수를 얻습니다. 이 회귀의 절편과 기울기가 앙상블 모형 예측 계산식에 적용되어 최종 SVEM 예측을 생성합니다. "표본" 옵션의 값이 10보다 작으면 이 단계를 건너뜁니다.

참고: "모형 적합" 시작 창에서 "검증" 열을 지정하면 SVEM 방법이 훈련 데이터 집합에 구현됩니다. 검증 및 테스트 데이터 집합은 테스트 데이터 집합으로 홀드백됩니다.

SVEM(자체 검증 앙상블 모델링) 방법에 대한 자세한 내용은 Lemkus et al. (2021) 연구 자료에서 확인하십시오.

더 많은 정보를 원하십니까? 질문이 있습니까? JMP 사용자 커뮤니티에서 답변 받기 (community.jmp.com).