이 예에서는 잠재 계층 모형을 적합시켜 12개 설문 조사 질문에 대한 학생들의 응답을 기반으로 학생 군집을 식별합니다. 응답은 2005년 미국 고등학생을 대상으로 한 설문 조사에서 나왔습니다. 설문 조사에서 학생들에게 건강 위험 행동과 관련된 다양한 선다형 질문을 했습니다. 분석 대상 열은 선다형 설문 조사 질문에서 응답을 두 개의 계층(Yes/No)으로 분류하여 얻었습니다.
1. 도움말 > 샘플 데이터 폴더를 선택하고 Health Risk Survey.jmp를 엽니다.
2. Health Risk Survey 데이터 테이블에서 Launch LCA Platform 스크립트 옆의 녹색 삼각형을 클릭합니다.
이 스크립트는 12개의 관심 대상 열을 선택하고 "잠재 계층 분석" 시작 창을 연 후 12개 열을 Y로 입력합니다.
참고: LCA 플랫폼을 직접 시작하려면 분석 > 군집화 > 잠재 계층 분석을 선택합니다.
3. 최대 옆의 상자에 "5"를 입력합니다.
이 옵션은 3개의 군집 및 최대 5개의 군집에 대한 잠재 계층 모형을 적합시킵니다.
4. 확인을 클릭합니다.
그림 16.2 군집 비교 보고서
"잠재 계층 분석" 개요에는"군집 비교" 보고서와 세 개의 개별 잠재 계층 모형 보고서가 포함됩니다. 잠재 계층 모형 보고서에는 3개, 4개, 5개 군집에 대한 모형이 각각 표시됩니다. "군집 비교" 보고서를 보면 5개 군집 모형의 BIC 및 AIC가 가장 작으며 이는 세 모형 중 이 모형이 최량 적합 모형이라는 것을 나타냅니다. 즉, 이 모형이 분석 대상입니다.
5. "5개 군집의 잠재 계층 모형" 보고서에서 "모수 추정값" 아래의 막대 차트를 검토합니다. 다음 사항에 유의하십시오.
– 군집 1은 모든 위험 행동에 대한 대답이 대부분 "No"입니다.
– 군집 2는 13세 이전의 네 가지 위험 행동에 대해 "Yes" 대답이 많습니다.
– 군집 3은 음주 운전 및 지난 30일 동안 5회 이상 음주에 대해 "Yes" 대답이 많습니다.
– 군집 4는 13세 이전의 행동을 제외한 대부분의 위험 행동에 대해 "Yes" 대답이 많습니다.
– 군집 5는 대부분의 위험 행동에 대해 "Yes" 대답이 가장 많습니다.
이 정보를 사용하여 군집에 의미 있는 이름을 지정합니다.
6. "5개 군집의 잠재 계층 모형" 옆의 빨간색 삼각형을 클릭하고 군집 이름 바꾸기를 선택합니다.
– 군집 1: Low Risk 입력
– 군집 2: Early Risk-Takers 입력
– 군집 3: Drinkers 입력
– 군집 4: Late High Risk 입력
– 군집 5: High Risk 입력
7. 확인을 클릭합니다.
참고: 새 군집 이름은 스크립트에 저장되지 않습니다.
그림 16.3 모수 추정값 보고서(일부)
Figure 16.3에서는 분석의 처음 8개 변수에 대한 모수 추정값을 보여 줍니다. 보고서 창에 새 군집 이름이 나타납니다.
이제 "In what grade are you"라는 인구 통계 질문에 대해 소속 군집을 비교합니다.
8. "5개 군집의 잠재 계층 모형" 옆의 빨간색 삼각형을 클릭하고 혼합 및 군집 계산식 저장을 선택합니다.
9. 그래프 > 그래프 빌더를 선택합니다.
10. In what grade are you를 X로 입력합니다.
11. 최대 확률 분류 군집 계산식을 Y로 입력합니다.
12. 모자이크 요소를 선택합니다.
13. 완료를 클릭합니다.
그림 16.4 소속 군집 대 학년의 모자이크 그림
대부분의 응답자가 "Low Risk" 군집에 속한다는 것을 알 수 있습니다. "Drinkers" 라벨이 지정된 계층은 학년이 올라갈수록 더 많은 응답자를 포함합니다.