이 예에서는 6개의 예측 변수를 사용하여 개수 반응에 대한 예측 모형을 개발합니다. 개수 반응은 Poisson 분포를 사용하여 모델링됩니다.
1. 도움말 > 샘플 데이터 폴더를 선택하고 Liver Cancer.jmp를 엽니다.
2. 분석 > 모형 적합을 선택합니다.
3. "열 선택" 목록에서 Node Count를 선택하고 Y를 클릭합니다.
4. BMI ~ Jaundice를 선택하고 매크로 > 특정 차수까지의 요인을 클릭합니다.
이렇게 하면 차수 2(차수 상자의 기본값)까지의 모든 항이 모형에 추가됩니다.
5. "열 선택" 목록에서 Validation을 선택하고 검증을 클릭합니다.
6. "분석법" 목록에서 일반화 회귀를 선택합니다.
7. "분포" 목록에서 Poisson을 선택합니다.
8. 실행을 클릭합니다.
"모형 비교" 보고서, "모형 시작" 제어판 및 "검증 열을 사용한 Poisson 최대 가능도" 보고서가 포함된 "일반화 회귀" 보고서가 나타납니다. 기본 추정 방법은 "Lasso 회귀"입니다.
9. 적응형 상자를 선택합니다.
10. 시작을 클릭합니다.
11. "검증 열을 사용한 Poisson 적응형 Lasso 회귀" 옆의 빨간색 삼각형을 클릭하고 0이 아닌 항 선택을 선택합니다.
Figure 7.1에는 해 경로가 나와 있습니다. 계수가 0이 아닌 항의 경로가 강조 표시됩니다. 해가 MLE에서 멀어질수록 해 경로가 그림의 오른쪽에서 왼쪽으로 움직인다고 생각할 수 있습니다. 여러 항에 상당히 일찍 0으로 축소하는 경로가 있습니다.
해 경로 그림의 세로 축은 표준화된 예측 변수의 모수 추정값을 나타냅니다. 빨간색 수직선은 교차 검증에 의해 결정된 최적 축소에서의 값을 나타냅니다. 이 점에서 11개 항의 계수가 0이 아닙니다. 빨간색 수직선은 검증 데이터 집합의 최소 척도화된 -1*로그 가능도 값을 나타냅니다.
그림 7.1 0이 아닌 항이 강조 표시된 적응형 Lasso 회귀 적합의 해 경로
"원래 예측 변수에 대한 모수 추정값" 보고서(Figure 7.2)에서는 비중심화 및 비척도화 데이터에 대한 모수 추정값을 보여 줍니다. 모수 추정값이 0이 아닌 11개 항이 강조 표시됩니다. 여기에 교호작용 효과가 포함되어 있습니다. 모든 예측 변수 열이 계수가 0이 아닌 항에 나타나므로 데이터 테이블에서 6개의 모든 예측 변수 열이 선택됩니다.
"효과 검정" 보고서에서 계수 추정값이 0인 10개 효과가 "제거"로 지정됩니다. "효과 검정" 보고서는 0.05 수준에서 하나의 효과(Age*Markers 교호작용)만 유의함을 나타냅니다.
그림 7.2 0이 아닌 항이 강조 표시된 모수 추정값 보고서
12. "원래 예측 변수에 대한 모수 추정값" 보고서에서 (Age - 56.3994)*Markers[0-1] 행을 클릭합니다.
이렇게 하면 해 경로 그림에서 해당 효과의 경로가 강조 표시되고 데이터 테이블에서 Age 및 Markers 열이 선택됩니다.
13. "검증 열을 사용한 Poisson 적응형 Lasso 회귀" 옆의 빨간색 삼각형을 클릭하고 열 저장 > 예측 계산식 저장 및 열 저장 > 분산 계산식 저장을 선택합니다.
Node Count 예측 계산식과 Node Count 분산이라는 두 열이 데이터 테이블에 추가됩니다.
14. 데이터 테이블에서 열 머리글 중 하나를 마우스 오른쪽 버튼으로 클릭하고 계산식을 선택하여 계산식을 확인합니다. 아니면 "열" 패널에서 열 이름 오른쪽의 더하기 기호를 클릭합니다.
예측 계산식 저장 열의 예측 계산식은 모형의 추정된 선형 부분에 지수 함수를 적용합니다. Poisson 분포의 분산이 평균과 같으므로 Node Count 분산의 예측 분산 계산식은 동일한 계산식으로 제공됩니다.