해 경로"일반화 회귀" 보고서의 "해 경로" 섹션에서는 다음 두 가지 그림을 보여 줍니다.
• 해 경로 그림 - 추정된 모수의 값을 표시합니다.
• 검증 그림 - 선택한 검증 방법에 해당하는 검증 통계량의 값을 표시합니다.
참고: "해 경로" 보고서는 최대 가능도, SVEM 전진 선택 및 SVEM Lasso를 제외한 모든 추정 방법에 대해 나타납니다. "해 경로" 보고서는 분위수 회귀를 제외한 모든 분포에 대해 나타납니다.
두 그림에 대한 수평 척도는 척도화된 모수 추정값 크기로 제공됩니다. 이 값은 평균 모형에 대한 척도화된 모수 추정값의 절대값을 합하여 정의되는 l1 노름입니다. 절편, 산포 모수 및 영과잉 모수에 해당하는 추정값은 l1 노름 계산에서 제외됩니다. 다음 사항에 유의하십시오.
• l1 노름 값이 큰 추정값은 MLE에 가깝습니다.
• l1 노름 값이 작은 추정값은 벌점이 크게 부과됩니다.
• l1 노름이 감소하면 조정 모수 값이 증가합니다.
현재 모형 표시자두 그림 모두 "원래 예측 변수에 대한 모수 추정값" 보고서에 표시된 해의 l1 노름 값에서 빨간색 수직 실선이 추가됩니다. 두 그림 중 하나에서 빨간색 수직선 맨 위의 화살표를 드래그하면 벌점 크기가 변경되어 새 현재 모형을 나타낼 수 있습니다. 검증 그림에서도 그림의 아무 곳이나 클릭하여 모형을 변경할 수 있습니다. 빨간색 수직선을 드래그하여 새 모형을 나타내면 보고서의 결과가 현재 선택된 모형을 반영하도록 업데이트됩니다. 수직 파선은 최량 적합 모형에 유지됩니다. 검증 그림 옆의 해 재설정 버튼을 클릭하면 빨간색 수직선 및 해당 결과가 초기 해로 돌아갑니다. 일부 검증 방법의 경우 비교 가능한 모형을 식별하는 영역이 검증 그림에 제공됩니다. 자세한 내용은 비교 가능 모형 영역에서 확인하십시오.
그림 6.5 Diabetes.jmp에 대한 해 경로 보고서(AICc 검증을 사용한 Lasso 회귀)
해 경로 그림에 대한 자세한 내용은 해 경로 그림에서 확인하십시오. 검증 그림에 대한 자세한 내용은 검증 그림에서 확인하십시오.
해 경로 그림해 경로 그림에서 경로를 선택하여 "모수 추정값" 보고서에서 해당 항을 강조 표시할 수 있습니다. 이렇게 하면 데이터 테이블의 해당 열도 선택됩니다. 하나의 보고서에서 행을 선택하면 다른 보고서의 해당 행과 해 경로 그림의 해당 경로가 강조 표시됩니다. 여러 경로 또는 행을 선택하려면 Shift 키를 누르고 클릭합니다.
모수 추정값은 해 경로 그림의 세로 축을 사용하여 그림에 표시됩니다. 이러한 값은 척도화된 모수 추정값입니다. 중심화 및 척도화된 예측 변수로 표현된 모형에 대해 값이 파생됩니다. 자세한 내용은 중심화 및 척도화된 예측 변수에 대한 모수 추정값에서 확인하십시오.
예측 변수의 수가 관측값 수보다 적으면 일반적으로 해 경로 그림에 추정값의 전체 범위(0 ~ MLE에 의해 주어진 벌점 없는 적합)가 표시됩니다. 그렇지 않으면 벌점이 부과되지 않은 해에 가까운 크기로 그림이 확장됩니다. 이 현상은 끝에서 두 번째 격자점에서 MLE 해까지의 이동이 너무 커서 끝에서 두 번째 격자점까지의 해에 대한 상세 정보가 분명하지 않을 때 발생합니다. 이 경우 MLE가 최종 해가 아니면 축이 끝에서 두 번째 격자점까지만 확장되도록 해 경로 그림의 척도가 재조정됩니다.
해 ID내부적으로 해 경로의 각 해에는 해 ID가 할당됩니다. 초기에 제공된 해가 아닌 다른 해를 선택하기 위해 조정 모수를 변경하면 해당 해 ID가 "스크립트 저장" 옵션으로 생성된 스크립트에 나타납니다. 해 ID는 해 ID 설정(N) 명령의 N 값입니다. 해 ID를 저장하면 스크립트를 실행할 때 선택한 해를 다시 생성할 수 있습니다.
검증 그림검증 그림에는 전체 조정 모수 값 또는 척도화된 모수 추정값 크기 값에 대한 모형의 적합 능력을 나타내는 통계량 그림이 표시됩니다. 표시된 통계량은 선택한 검증 방법에 따라 다릅니다. Table 6.3에는 각 검증 방법에 대해 표시되는 통계량이 나열되어 있습니다. 모든 검증 방법에서 값이 작을수록 좋습니다. K 폴드 및 Leave-One-Out 검증 방법과 값이 세 개 이상인 검증 열의 경우 표시되는 통계량은 전체 폴드에서 척도화된 음의 로그 가능도 값의 평균입니다.
Table 6.3에서 척도화된 -1*로그 가능도는 음의 로그 가능도를 음의 로그 가능도가 계산되는 집합의 관측값 수로 나눈 값입니다.
검증 방법 | 검증 통계량 | 조정 모수 영역 |
|---|---|---|
K 폴드 | 전체 K 폴드에 대해 척도화된 -1*로그 가능도 값의 평균 | 두 개 |
홀드백 | 척도화된 -1*로그 가능도 | 없음 |
Leave-One-Out | 모든 폴드에 대해 척도화된 -1*로그 가능도 값의 평균 | 두 개 |
BIC | 훈련 데이터의 BIC | 두 개 |
AICc | 훈련 데이터의 AICc | 두 개 |
ERIC | 훈련 데이터의 ERIC | 두 개 |
두 개 또는 세 개의 값이 있는 검증 열 | 척도화된 -1*로그 가능도 | 없음 |
K > 3개의 값이 있는 검증 열 | 전체 K 폴드에 대해 척도화된 -1*로그 가능도 값의 평균 | 두 개 |
비교 가능 모형 영역모형이 최적 모형으로 추정되지만 이 선택과 관련하여 불확실성이 존재할 수 있습니다. 경쟁 모형도 거의 적합할 수 있으며 유용한 정보를 포함할 수 있습니다. AICc, BIC, ERIC, K 폴드 및 Leave-One-Out 검증 방법과 4개 이상의 값이 있는 검증 열의 경우, 고려할 만한 경쟁 모형을 식별하는 영역이 검증 그림에 제공됩니다. 이 영역을 벗어나는 모형은 권장되지 않습니다. 자세한 내용은 Burnham & Anderson(2004) 및 Burnham et al. (2011)에서 확인하십시오.
영역은 검증 통계량 값의 구간입니다. 이러한 영역은 전체 가로 축에 걸쳐 녹색 또는 노란색 직사각형으로 표시됩니다. 검증 통계량 값이 영역에 포함되면 모형이 해당 영역에 포함됩니다. 빨간색 수직 실선을 드래그하여 영역 내의 해를 탐색할 수 있습니다. 자세한 내용은 현재 모형 표시자에서 확인하십시오.
Figure 6.6에서는 두 영역을 표시하기 위해 세로 축이 확장된 Diabetes.jmp에 대한 검증 그림을 보여 줍니다.
그림 6.6 Diabetes.jmp에 대한 검증 그림(AICc 검증을 사용한 Lasso 회귀)
이러한 검증 방법의 경우 두 영역이 그림에 표시됩니다. 최적 해를 위한 검증 BIC, AICc 및 ERIC 값을 Vbest로 나타냅니다.
• 녹색 영역은 모형이 최적 모형과 유사하다는 강력한 증거가 있는 모형을 식별합니다. 녹색 영역 구간은 [Vbest, Vbest+4]입니다.
• 노란색 영역은 모형이 최적 모형과 유사하다는 약한 증거가 있는 모형을 식별합니다. 노란색 영역 구간은 (Vbest+4, Vbest+10]입니다.
이러한 검증 방법의 경우 두 영역이 그림에 표시됩니다. 최적 모형을 위한 해에서 각 검증 데이터 집합에 대해 척도화된 음의 로그 가능도 함수가 실행됩니다. 이러한 값의 표준 오차를 LSE로 나타냅니다. 최적 해에 대한 척도화된 음의 로그 가능도는 Lbest로 나타냅니다.
• 녹색 영역은 모형이 최적 모형과 유사하다는 강력한 증거가 있는 모형을 식별합니다. 녹색 영역 구간은 [Lbest, Lbest+LSE]입니다.
• 노란색 영역은 모형이 최적 모형과 유사하다는 약한 증거가 있는 모형을 식별합니다. 노란색 영역 구간은 (Lbest+LSE, Lbest+2.5*LSE]입니다.