발행일 : 03/10/2025

Image shown here서포트 벡터 머신 모형 보고서

적합된 각 모형은 다음 섹션을 포함하는 모형 보고서를 생성합니다.

반응 프로파일 그림

(반응이 범주형인 경우에만 사용 가능) 분류 모형의 시각적 표현을 제공합니다. 그림의 점은 실제 데이터 관측값이며 정확히 두 개의 연속형 변수가 있는 경우에만 기본적으로 표시됩니다. 표시된 두 변수의 경우 음영 등고선은 나머지 모형 요인의 고정 값에 의해 결정된 예측 공간의 평면을 나타냅니다. 예측은 플랫폼에서 계산되는 분류 결정 규칙을 기반으로 합니다. 고정 값에 대한 컨트롤은 그림 위에 있습니다. 슬라이더 또는 숫자 상자를 사용하여 요인의 고정 값을 변경하면 표시된 변수의 예측 공간이 자동으로 업데이트됩니다. 각 축의 빨간색 삼각형을 사용하면 그림의 축을 변경하여 연속형 요인을 표시할 수도 있습니다.

"반응 프로파일 그림"의 빨간색 삼각형 메뉴에는 다음 옵션이 포함되어 있습니다.

격자 밀도

음영 등고선의 기반이 되는 예측 격자의 정밀도를 결정합니다. 격자 밀도가 높을수록 더 매끄러운 결정선이 표시됩니다.

점 표시

그림에 점을 표시하거나 숨깁니다. 변수가 두 개뿐인 경우 기본적으로 선택되어 있습니다.

모형 요약

반응 열 이름, 검증 방법 및 모형 적합에 사용된 커널 함수 유형을 제공합니다. "모형 요약" 테이블에는 훈련, 검증 및 테스트 데이터 집합에 대한 모형 적합 정보도 포함되어 있습니다. 각 집합에 대해 관측값 수와 서포트 벡터 수가 보고됩니다. 반응이 범주형이면 각 집합에 대해 오분류 비율이 보고됩니다. 오분류 비율은 모형에 의해 잘못 분류된 관측값의 비율입니다. 이 값은 오분류 수를 총 관측값 수로 나누어 계산됩니다. 반응이 연속형이면 각 집합에 대해 RASE 및 R² 값이 보고됩니다.

추정 상세 정보

모형에 사용된 모수의 값을 제공합니다.

적합 상세 정보

(반응이 범주형인 경우에만 사용 가능) 훈련 데이터 집합과 검증 및 테스트 데이터 집합(지정된 경우)에 대한 다음 통계량을 제공합니다.

엔트로피 R²

적합 모형과 상수 확률 모형의 로그 가능도를 비교하는 적합 측도입니다. 엔트로피 R² 범위는 0 ~ 1이며, 값이 1에 가까울수록 더 나은 적합을 나타냅니다. 자세한 내용은 엔트로피 R²에서 확인하십시오.

일반화 R²

일반 회귀 모형에 적용할 수 있는 측도입니다. 이 값은 가능도 함수 L을 기반으로 하며 최대값이 1이 되도록 척도화됩니다. 일반화 R² 측도는 표준 최소 제곱 설정 시 연속형 정규 반응에 대한 기존 R²으로 단순화됩니다. 일반화 R²을 Nagelkerke 또는 Craig와 Uhler R2이라고도 하는데, 이는 Cox-Snell 유사 R2을 정규화한 것입니다. 자세한 내용은 Nagelkerke 연구 자료(1991)에서 확인하십시오. 값이 1에 가까울수록 더 나은 적합을 나타냅니다.

평균 -Log p

-Log(p)의 평균입니다. 여기서 p는 발생한 사건과 연관된 적합 확률입니다. 값이 작을수록 더 나은 적합을 나타냅니다.

RASE

평균 제곱 예측 오차의 제곱근입니다(제곱근 평균 제곱 오차). RASE는 다음과 같이 계산되며, 여기서 Source는 훈련, 검증 또는 테스트 데이터 집합을 나타냅니다.

Equation shown here

평균 절대 편차

반응과 예측 반응 사이의 차이에 대한 절대값의 평균입니다. 차이는 1에서 p(실제로 발생한 반응 수준의 적합 확률) 사이입니다. 값이 작을수록 더 나은 적합을 나타냅니다.

오분류 비율

적합 확률이 가장 높은 반응 범주가 관측된 범주가 아닌 비율입니다.

참고:"적합 상세 정보" 보고서의 오분류 비율이 "혼동 행렬" 보고서의 오분류 비율과 일치하지 않을 수 있습니다. 이항 반응의 경우 "적합 상세 정보" 보고서의 비율은 확률 경계 0.5를 사용하지만 "혼동 행렬" 보고서의 비율은 확률 임계값을 경계로 사용합니다.

N

관측값 수입니다.

혼동 행렬

(반응이 범주형인 경우에만 사용 가능) 모형에 지정된 각 데이터 집합(훈련, 검증 및 테스트)에 대한 혼동 행렬이 표시됩니다. 혼동 행렬은 실제 반응과 예측 반응의 이원 분류입니다. 혼동 행렬과 오분류 비율을 사용하여 모형을 평가할 수 있습니다.

혼동 행렬과 오분류 비율은 확률 임계 상자의 값을 경계 값으로 사용합니다. 기본적으로 이 값은 플랫폼에서 계산되는 분류 결정 규칙을 기반으로 합니다. 슬라이더를 드래그하거나 "확률 임계" 옆의 상자에 새 값을 입력하여 경계 값을 변경할 수 있습니다. 확률 임계를 변경하면 혼동 행렬과 오분류 비율이 자동으로 업데이트됩니다. "모형 비교" 보고서의 확률 임계 및 조건부 검증 오분류 비율 열도 업데이트됩니다.

실제값 대 예측값 그림

(반응이 연속형인 경우에만 사용 가능) 실제 반응 대 예측 반응 그림을 표시합니다. 대각선은 Y = X 선입니다. 점이 이 선에 가까울수록 모형이 데이터를 더 잘 적합시킵니다. 검증이 사용되면 훈련 및 검증 데이터 집합과 테스트 데이터 집합(지정된 경우)에 대해 그림이 표시됩니다.

더 많은 정보를 원하십니까? 질문이 있습니까? JMP 사용자 커뮤니티에서 답변 받기 (community.jmp.com).