발행일 : 03/10/2025

Image shown here모형 시작 제어판

서포트 벡터 머신 플랫폼을 시작하면 모형 적합을 위한 "모형 시작" 제어판이 나타납니다. "모형 시작" 제어판을 사용하여 커널 함수 및 관련 모수 값과 검증 방법을 지정할 수 있습니다.

그림 9.5 모형 시작 제어판 

The Model Launch Control Panel

"모형 시작" 제어판에는 다음 옵션이 포함되어 있습니다.

커널 함수

모형에 사용되는 커널 함수를 지정합니다. 다음 커널 함수 중 하나를 선택할 수 있습니다.

방사 기저 함수

클래스를 구분하는 비선형 초평면을 생성하려면 방사 기저 함수 커널을 선택합니다.

"비용" 모수는 훈련 데이터 집합의 관측값을 잘못 분류하는 것과 관련된 벌점입니다. 비용 모수가 높을수록 훈련 데이터 집합의 점을 잘못 분류할 가능성이 낮은 알고리즘이 구현되는 반면, 비용 모수가 낮을수록 마진이 더 넓어집니다. "비용" 모수는 0보다 커야 하며 기본값은 1입니다.

"감마" 모수는 커널 함수의 모수입니다. 이 모수는 결정선에 대한 곡률의 정도를 결정합니다. 감마 값이 높을수록 곡률이 크다는 것을 나타냅니다. 비선형 결정선은 더 유연한 적합을 제공하지만 곡률이 너무 크면 과대적합이 발생할 수 있습니다. "감마" 모수는 0보다 커야 하며 기본값은 1/(예측 변수의 수)입니다.

선형

클래스를 구분하는 선형 초평면을 생성하려면 선형 커널 함수를 선택합니다.

"비용" 모수는 훈련 데이터 집합의 관측값을 잘못 분류하는 것과 관련된 벌점입니다. 비용 모수가 높을수록 훈련 데이터 집합의 점을 잘못 분류할 가능성이 낮은 알고리즘이 구현되는 반면, 비용 모수가 낮을수록 마진이 더 넓어집니다. "비용" 모수는 0보다 커야 하며 기본값은 1입니다.

참고: 범위를 벗어난 모수 값을 지정하면 기본값이 사용됩니다.

팁: 최량 적합 모형을 찾으려면 다양한 커널 함수 및 모수 값을 적합시키고 "모형 비교" 보고서를 사용하십시오.

설계 조정

지정된 커널에 대한 모수 값 범위를 적합시킬 수 있습니다. R²이 가장 크고 오분류 비율 또는 RASE가 가장 작은 모형이 "모형 비교" 보고서에서 식별됩니다. "설계 조정"을 선택한 후에는 모수의 최소값과 최대값을 지정해야 합니다. 데이터를 기반으로 한 기본값이 제공되며 최소값은 0보다 커야 합니다. "런 수"의 값도 지정해야 합니다. SVM 플랫폼은 최소값과 최대값에 의해 결정된 모수 값 격자에서 많은 모형을 적합시킵니다.

검증 방법

모형 검증 방법을 지정합니다. "시작" 버튼을 처음 클릭하면 지정된 검증 방법을 사용하여 첫 번째 SVM 모형이 적합됩니다. 그런 다음 SVM 창 내에서 적합된 모든 SVM 모형에 이 검증 방법이 사용됩니다. 이렇게 하면 보고서 창의 모든 모형이 동일한 검증 방법 및 검증 데이터 집합을 사용하여 적합됩니다.

홀드백

원래 데이터를 무작위로 훈련 데이터 집합과 검증 데이터 집합으로 나눕니다. 원래 데이터에서 검증 데이터 집합으로 사용할 비율을 지정할 수 있습니다(홀드백).

K 폴드

(Y가 연속형 또는 명목형인 경우에만 사용 가능) 원래 데이터를 무작위로 K개의 부분집합으로 나눕니다. 그러면 K개의 모형 전체를 적합시킬 때 K개의 집합 각각이 나머지 데이터에 대한 모형 적합을 검증하는 데 사용됩니다. Y가 연속형이면 최량 검증 RASE 통계량을 제공하는 모형이 최종 모형으로 선택됩니다. Y가 명목형이면 최량 검증 오분류 비율을 제공하는 모형이 최종 모형으로 선택됩니다.

검증 열

(시작 창에서 "검증" 열을 지정한 경우에만 사용 가능) 지정된 "검증" 열의 값을 사용하여 데이터를 여러 부분으로 나눕니다. 열의 값은 데이터가 분할되는 방법과 검증에 사용되는 방법을 결정합니다.

두 개의 값이 있는 경우 더 작은 값이 훈련 데이터 집합을 정의하고 더 큰 값이 검증 데이터 집합을 정의합니다.

세 개의 값이 있는 경우 작은 값부터 순서대로 훈련 데이터 집합, 검증 데이터 집합, 테스트 데이터 집합을 각각 정의합니다.

검증 열에 네 개 이상의 수준이 있는 경우 "검증 열 K 폴드"가 사용됩니다.

SVM 플랫폼에서는 "설계 조정"이 사용되는 경우 외에는 검증 열을 사용하여 모형을 훈련하고 평가합니다. "설계 조정" 옵션을 선택하는 경우 SVM 플랫폼에서는 검증 열을 사용하여 모형을 훈련 및 조정하거나 모형을 훈련, 조정 및 평가합니다. 검증에 대한 자세한 내용은 JMP 모델링의 검증에서 확인하십시오.

참고:검증 열을 사용하여 데이터가 올바르게 분할되지 않으면 홀드백 검증 방법이 대신 사용됩니다.

검증 열 K 폴드

("Y, 반응" 열에 정확히 두 개의 수준이 있고 시작 창에서 "검증" 열을 지정한 경우에만 사용 가능) 지정된 "검증" 열의 값을 사용하여 데이터를 K개의 집합으로 나눕니다. 여기서 K는 열의 고유 값 수입니다. 그런 다음 K 폴드 검증이 수행됩니다.

없음

검증이 사용되지 않습니다.

시작

지정된 SVM 모형을 적합시키고 모형 보고서를 표시합니다.

참고: 데이터 테이블이 큰 경우 데이터에 적합되는 각 모형에 대해 진행률 표시줄이 나타납니다. 총 적합 모형 수는 k!/2(k-2)!이며, 여기서 k는 반응 변수의 수준 수입니다. 각 진행률 표시줄에는 현재 추정값 채택 버튼이 있습니다. 적합 알고리즘을 조기에 중지하고 현재 추정값을 채택하려면 이 버튼을 클릭합니다. 이 버튼을 클릭한 후 예측 계산이 수행되므로 보고서가 나타나는 데 시간이 걸릴 수 있습니다.

결측값

예측 변수에 대해 결측값이 있는 행은 SVM 모델링 절차에 포함되지 않습니다. 따라서 데이터 테이블에 저장된 모든 열은 해당 행에 결측값을 포함합니다. 결측값이 있는 데이터를 SVM 모형에 포함하려면 전처리 작업이 필요합니다. 자세한 내용은 결측값 탐색에서 확인하십시오.

더 많은 정보를 원하십니까? 질문이 있습니까? JMP 사용자 커뮤니티에서 답변 받기 (community.jmp.com).