이 예에서는 이항 반응에 대해 Elastic Net 추정 방법을 사용하여 예측 모형을 개발하는 방법을 보여 줍니다.
1. 도움말 > 샘플 데이터 폴더를 선택하고 Liver Cancer.jmp를 엽니다.
2. 분석 > 모형 적합을 선택합니다.
3. "열 선택" 목록에서 Severity를 선택하고 Y를 클릭합니다.
4. BMI ~ Jaundice를 선택하고 매크로 > 특정 차수까지의 요인을 클릭합니다.
차수 2(차수 상자의 기본값)까지의 모든 항이 모형에 추가됩니다.
5. "분석법" 목록에서 일반화 회귀를 선택합니다.
"분포" 목록에 "이항" 분포가 자동으로 표시됩니다. Y가 이항 변수이고 명목형 모델링 유형일 때는 이 분포만 사용할 수 있습니다.
6. 실행을 클릭합니다.
"모형 비교" 보고서, "모형 시작" 제어판 및 "로지스틱 회귀" 보고서가 포함된 "일반화 회귀" 보고서가 나타납니다. 기본 추정 방법은 "Lasso 회귀"입니다.
7. "추정 방법"에서 Elastic Net을 선택합니다.
8. 적응형 상자를 선택합니다.
9. 시작을 클릭합니다.
"AICc 검증을 사용한 이항 적응형 Elastic Net" 보고서가 나타납니다. Figure 7.3에는 해 경로가 나와 있습니다.
그림 7.3 해 경로 그림
계수가 0이 아닌 항의 경로가 파란색으로 표시됩니다. 최적 모수 값은 MLE에서 상당히 축소됩니다. 오른쪽의 검증 그림은 몇 가지 모형을 최적 모형으로 고려할 수 있음을 나타냅니다. 해당 모형을 보려면 녹색 부분에 검은색 선이 있는 영역에서 빨간색 세로 막대를 움직입니다.
10. "AICc 검증을 사용한 이항 적응형 Elastic Net" 옆의 빨간색 삼각형을 클릭하고 0인 항 선택 옵션을 선택합니다.
"원래 예측 변수에 대한 모수 추정값" 보고서에서 계수 추정값이 0인 16개 항이 강조 표시됩니다. 이 항은 "효과 검정" 보고서에 "제거"로 지정됩니다.
또한 "효과 검정" 보고서는 0.05 수준에서 유의한 항이 없음을 보여 줍니다. 그러나 Time*Markers 교호작용의 p 값(0.0626)이 작고 Time 효과의 p 값(0.1458)도 작습니다.
11. "AICc 검증을 사용한 이항 적응형 Elastic Net" 옆의 빨간색 삼각형을 클릭하고 프로파일러 > 프로파일러를 선택합니다.
그림 7.4 Severity = High일 때 Time이 낮을 확률에 대한 프로파일러
예측 프로파일러를 검토하여 Time 및 Time*Markers 교호작용이 Severity에 미치는 영향을 확인합니다.
참고: Hepatitis 예측 변수는 활성(0이 아님) 항에 나타나지 않으므로 프로파일러에 표시되지 않습니다. Markers와 Jaundice는 활성 교호작용 항에 나타나므로 주효화가 활성이 아니더라도 프로파일러에 표시됩니다.
12. Time의 빨간색 파선을 왼쪽에서 오른쪽으로 움직여 Markers와의 교호작용을 확인합니다(Figure 7.4 및 Figure 7.5). 진단 이후 Time 값이 작은 환자의 경우 Markers는 Severity에 거의 영향을 주지 않습니다. 그러나 장기간 진단을 받고 연구에 참여한 환자의 경우 Markers가 중요합니다. 이러한 환자에게 정상 표지자는 Severity가 높을 확률이 낮음을 나타냅니다.
그림 7.5 Severity = High일 때 Time이 높을 확률에 대한 프로파일러