선형 모형 적합 > 일반화 회귀 예 > 영과잉 Poisson 회귀의 예
발행일 : 03/10/2025

영과잉 Poisson 회귀의 예

이 예에서는 모형 적합 플랫폼의 일반화 회귀 분석법을 사용하여 영과잉 Poisson 회귀 모형을 적합시키는 방법을 보여 줍니다. 영과잉 Poisson 분포는 여러 소스에서 0 반응이 나올 수 있는 개수 데이터에 적절합니다.

이 예에서는 공원 방문자 그룹이 잡은 물고기 수에 대한 데이터를 분석합니다. 이 예의 데이터 테이블에는 공원을 방문하는 250개 그룹이 잡은 물고기 수에 영향을 미칠 수 있는 5가지 요인이 자세히 나와 있습니다.

데이터 수집 중 그룹의 누군가가 실제로 낚시를 했는지 여부는 확인되지 않았습니다. 그러나 두 가지 경우(그룹에서 낚시를 한 사람이 아무도 없거나 그룹에서 낚시를 한 모든 사람이 운이 없었음) 중 하나를 통해 물고기를 잡지 못하는 상황이 발생할 수 있다는 점을 강조하기 위해 숨겨진 Fished 열이 테이블에 포함되었습니다. 따라서 두 가지 원인을 통해 반응이 0일 수 있습니다. 이 문제를 해결하기 위해 영과잉 분포를 적합시킬 수 있습니다. Poisson 분포는 낚시를 한 사람에 대한 개수 데이터에 적합하므로 영과잉 Poisson 분포를 적합시킵니다.

1. 도움말 > 샘플 데이터 폴더를 선택하고 Fishing.jmp를 엽니다.

2. 분석 > 모형 적합을 선택합니다.

3. "열 선택" 목록에서 Fish Caught를 선택하고 Y를 클릭합니다.

4. Live Bait ~ Children을 선택하고 매크로 > 특정 차수까지의 요인을 클릭합니다.

차수 2(차수 상자의 기본값)까지의 항이 모형에 추가됩니다.

5. "열 선택" 목록에서 "Validation"을 선택하고 검증을 클릭합니다.

6. "분석법" 목록에서 일반화 회귀를 선택합니다.

7. "분포" 목록에서 ZI Poisson을 선택합니다.

8. 실행을 클릭합니다.

"모형 비교" 보고서, "모형 시작" 제어판 및 "검증 열을 사용한 ZI Poisson 최대 가능도" 보고서가 포함된 "일반화 회귀" 보고서가 나타납니다. 기본 추정 방법은 "Lasso 회귀"입니다.

9. "추정 방법" 목록에서 Elastic Net을 선택합니다.

10. 시작을 클릭합니다.

"검증 열을 사용한 ZI Poisson Elastic Net" 보고서가 나타납니다. "해 경로", "원래 예측 변수에 대한 모수 추정값" 보고서 및 "효과 검정" 보고서에서 하나의 항이 0임을 나타냅니다. 두 개의 모수 추정값 보고서에서 마지막 줄에 추정값이 표시된 영과잉 모수는 매우 유의합니다. 이것은 반응(Fish Caught)에서 나타난 일부 변동은 일부 그룹이 낚시를 하지 않았기 때문일 수 있음을 나타냅니다.

그림 7.6 원래 예측 변수에 대한 모수 추정값 보고서 

Parameter Estimates for Original Predictors Report

"효과 검정" 보고서는 0.05 수준에서 네 개의 항, 즉 Live Bait, Fishing Poles, Fishing Poles*CamperFishing Poles*Children이 유의함을 나타냅니다.

11. "검증 열을 사용한 ZI Poisson Elastic Net" 옆의 빨간색 삼각형을 클릭하고 프로파일러 > 프로파일러를 선택합니다.

12. "예측 프로파일러"의 빨간색 삼각형을 클릭하고 최적화 및 만족도 > 만족도 함수를 선택합니다.

반응에 함수가 적용되어 Fish Caught 수를 최대화하는 것이 만족도가 높음을 나타냅니다. 만족도 함수에 대한 자세한 내용은 프로파일러만족도 프로파일링 및 최적화에서 확인하십시오.

13. "예측 프로파일러"의 빨간색 삼각형을 클릭하고 최적화 및 만족도 > 만족도 최대화를 선택합니다.

그림 7.7 Fish Caught가 최대화된 예측 프로파일러 

Prediction Profiler with Fish Caught Maximized

예측 변수의 설정을 변경하여 유의한 효과, 즉 Live Bait, Fishing Poles, Fishing Poles*CamperFishing Poles*Children의 영향을 확인할 수 있습니다. 예를 들어 Live Bait는 더 많은 물고기와 관련이 있고, Camper는 캠핑을 하지 않는 사람보다 낚싯대를 더 많이 가져와 더 많은 물고기를 잡는 경향이 있습니다.

14. "검증 열을 사용한 ZI Poisson Elastic Net" 옆의 빨간색 삼각형을 클릭하고 열 저장 > 예측 계산식 저장열 저장 > 분산 계산식 저장을 선택합니다.

Fish Caught 예측 계산식Fish Caught 분산이라는 두 열이 데이터 테이블에 추가됩니다.

15. 데이터 테이블에서 열 머리글 중 하나를 마우스 오른쪽 버튼으로 클릭하고 계산식을 선택하여 계산식을 확인합니다. 아니면 "열" 패널에서 열 이름 오른쪽의 더하기 기호를 클릭합니다. 두 계산식에서 모두 추정된 영과잉 모수가 0.781522155로 나타납니다.

더 많은 정보를 원하십니까? 질문이 있습니까? JMP 사용자 커뮤니티에서 답변 받기 (community.jmp.com).