예측 및 전문 모델링 > 모형 선별 > 모형 선별 플랫폼 시작
발행일 : 03/10/2025

Image shown here모형 선별 플랫폼 시작

모형 선별 플랫폼을 시작하려면 분석 > 예측 모델링 > 모형 선별을 선택합니다.

그림 10.3 모형 선별 시작 창 

The Model Screening Launch Window

"열 선택"의 빨간색 삼각형 메뉴에 포함된 옵션에 대한 자세한 내용은 열 필터 메뉴JMP 사용에서 확인하십시오.

Y, 반응

분석할 하나 이상의 반응 변수입니다.

X, 요인

예측 변수입니다.

가중치

(K 최근접 이웃, 서포트 벡터 머신 또는 신경망 모델링 플랫폼에는 적용할 수 없음) 분석의 각 행에 가중치를 할당하는 숫자 값이 포함된 열입니다.

빈도

(K 최근접 이웃 모델링 플랫폼에는 적용할 수 없음) 분석의 각 행에 빈도를 할당하는 숫자 값이 포함된 열입니다.

검증

(시작 창에서 "교차 검증" 옵션을 선택한 경우에는 적용할 수 없음) 검증 데이터 집합을 정의하는 숫자 열입니다. "열 선택" 목록에서 아무 열도 선택하지 않은 상태로 "검증" 버튼을 클릭하면 데이터 테이블에 검증 열을 추가할 수 있습니다. "검증 열 생성" 유틸리티에 대한 자세한 내용은 검증 열 생성에서 확인하십시오.

참고: 네 개 이상의 수준이 있는 검증 열을 지정하는 경우 이 열은 K 폴드 교차 검증을 수행하는 데 사용됩니다.

기준

개별 분석을 정의하는 수준이 포함된 하나 이상의 열입니다. 지정된 열의 각 수준에 대해 해당 행은 사용자가 지정한 다른 변수를 사용하여 분석됩니다. 결과는 개별 보고서에 제공됩니다. 기준 변수가 둘 이상 할당되면 기준 변수의 가능한 각 수준 조합에 대해 개별 보고서가 생성됩니다.

방법

원하는 모델링 플랫폼을 선택할 수 있습니다. 기본적으로 적합되는 모델링 플랫폼은 "의사 결정 나무(파티션)", "붓스트랩 포레스트", "부스티드 트리", "K 최근접 이웃", "신경망", "서포트 벡터 머신", "판별", "최소 제곱 적합", "단계별 회귀 적합", "로지스틱 회귀" 및 "일반화 회귀"입니다. "나이브 베이즈", "부분 최소 제곱" 및 "XGBoost"도 사용할 수 있습니다.

참고:

XGBoost는 JMP에서 지원되지 않으며 XGBoost 추가기능이 설치된 경우에만 사용할 수 있습니다. XGBoost에 대한 자세한 내용은 community.jmp.com에서 확인하십시오.

의사 결정 나무(파티션), 판별 및 부분 최소 제곱 방법 모두 모형을 적합시키려면 특정 유형의 검증 데이터 집합이 필요합니다.

검증 데이터 집합의 관측값이 20개 미만인 경우 의사 결정 나무(파티션) 모형을 적합시킬 수 없습니다.

모델링 플랫폼에서는 기본 옵션 및 조정 모수를 사용하여 모형을 적합시킵니다. 플랫폼을 직접 호출하고 다른 옵션을 선택하여 기본 설정을 사용할 때보다 적합성을 향상시킬 수 있습니다.

일반화 회귀의 "추가 방법" 옵션은 일반화 회귀 플랫폼에서 능형 회귀, Elastic Net 및 Lasso 회귀와 같은 몇 가지 추가 방법을 호출합니다. Lasso 회귀 방법의 경우 관측값이 1000개 미만이고 변수가 100개 미만이면 "조기 중지"가 비활성화됩니다. 자세한 내용은 일반화 회귀 모형선형 모형 적합에서 확인하십시오.

주의: 이로 인해 추가 모형 적합이 생성됩니다.

모델링 옵션

모델링 플랫폼에 대한 추가 옵션을 제공합니다.

이원 교호작용 추가

모든 이원 교호작용 효과를 선형 모형에 추가합니다.

2차 추가

연속형 변수의 제곱에 대한 효과를 선형 모형에 추가합니다.

결측값 정보화

모든 플랫폼에 대해 결측값 정보화를 활성화합니다.

작업 옵션

추가 옵션을 제공합니다.

난수 시드값 설정

모형 적합 루틴의 랜덤 성분에 사용되는 난수 시드값을 설정합니다. 이렇게 하면 플랫폼을 다시 실행하고 동일한 모형 적합을 얻을 수 있습니다.

개별 시간 한계

각 적합에 대한 시간 한계(초)를 지정합니다. 조기 중지를 지원하는 플랫폼의 경우 해당 시점까지의 최적 추정값이 제공됩니다. 조기 중지를 지원하지 않는 플랫폼의 경우 결과가 제공되지 않습니다.

Live 보고서 제거

"모형 선별" 보고서 창에 개별 모형 플랫폼 보고서를 포함하지 않습니다.

팁: 많은 방법과 적합이 포함된 큰 문제의 경우 이 옵션을 선택하여 메모리를 확보할 수 있습니다.

실행 시 로그에 방법 표시

적합 플랫폼이 호출될 때마다 진행 메시지를 로그에 기록합니다.

폴드 교차 검증

다양한 유형의 교차 검증에 대한 옵션을 제공합니다.

K 폴드 교차 검증

데이터를 무작위로 K개의 부분 또는 폴드로 나눕니다. 모형 생성을 위해 K-1개의 폴드를 사용하여 모형이 데이터에 적합되고, 나머지 폴드는 교차 검증에 사용됩니다. 총 K개 모형에 대해 이 과정이 K회 반복됩니다. K의 기본값은 5입니다.

K는 K 폴드 교차 검증을 위한 폴드 수를 지정합니다. 기본값은 5이고 K는 1보다 커야 합니다.

최적 모형에 대한 결과가 제공됩니다.

내포 교차 검증

교차 검증을 위해 데이터를 내포된 폴드로 나눕니다. 먼저 데이터를 k = 1, ..., K개의 동일한 부분 또는 폴드로 나눕니다. 각 폴드에 대해 k번째 폴드는 테스트 데이터 집합으로 사용되고, 나머지 데이터는 L개의 동일한 부분으로 추가 분할됩니다. 이러한 L개의 구분을 내측 폴드라고 합니다. 그런 다음 L-1개의 내측 폴드를 사용하여 모형이 데이터에 적합되고, 나머지 내측 폴드는 매번 교차 검증 집합으로 홀드아웃됩니다. 그런 다음 L개의 모형이 k번째 폴드를 공통 테스트 데이터 집합으로 사용합니다. 총 K*L개 모형이 적합됩니다. K의 기본값은 4이고 L의 기본값은 5입니다.

예를 들어 K = 2, L = 3으로 설정합니다. 처음에는 데이터가 두 개의 폴드로 구분됩니다. 첫 번째 폴드는 테스트 데이터 집합으로 홀드아웃되고 두 번째 폴드는 3개의 내측 폴드로 구분됩니다. 세 개의 모형이 데이터에 적합되고, 매번 교차 검증 집합으로 홀드아웃된 서로 다른 내측 폴드가 사용됩니다. 그러면 세 개 모형이 모두 첫 번째 폴드에서 테스트됩니다.

그런 다음 두 번째 폴드가 테스트 데이터 집합으로 홀드아웃되고 첫 번째 폴드는 3개의 내측 폴드로 구분됩니다. 세 개의 모형이 데이터에 적합되고, 매번 교차 검증 집합으로 홀드아웃된 서로 다른 내측 폴드가 사용됩니다. 그러면 세 개 모형이 모두 두 번째 폴드에서 테스트됩니다.

K는 내포 교차 검증을 위한 폴드 수를 지정합니다. 기본값은 4이고 K는 1보다 커야 합니다.

L은 내포 교차 검증을 위한 내측 폴드 수를 지정합니다. 기본값은 5이고 L은 1보다 커야 합니다.

참고: "K 폴드 교차 검증"과 "내포 교차 검증"을 모두 선택하면 "내포 교차 검증"이 수행됩니다.

반복 K 폴드

K 폴드 교차 검증 또는 내포 교차 검증 프로세스의 반복 횟수를 지정합니다.

"확인"을 클릭하면 지정된 모형이 적합되고 진행률 표시줄 집합이 표시됩니다. 위쪽 진행률 표시줄은 모든 적합에 대한 진행률을 보고합니다. 아래쪽 진행률 표시줄은 현재 개별 모형 적합에 대한 진행률을 보고합니다. 아래쪽 진행률 표시줄은 조기 중지를 사용하여 중지할 수 있으며 위쪽 진행률 표시줄은 계속 실행됩니다.

더 많은 정보를 원하십니까? 질문이 있습니까? JMP 사용자 커뮤니티에서 답변 받기 (community.jmp.com).