|
데이터 |
이 예에서는 442명의 당뇨병 환자 데이터를 사용합니다. 데이터에는 기준 임상 및 실험실 데이터뿐만 아니라 각 환자가 병원에 처음 내원한 후 1년 동안 얻은 당뇨병 진행 경과의 이진 측정값이 포함되어 있습니다. 이 측정값은 질병 경과를 Low 또는 High로 분류합니다. |
|
기법 |
이 예에서는 중첩 히스토그램과 능선 차트를 사용합니다. |
|
목표 |
이 예의 목표는 범주별로 그룹화된 연속형 변수의 분포를 탐색하는 것입니다. 특히 성별 및 질병 경과에 따라 HDL 분포가 어떻게 달라지는지를 탐색하려고 합니다. |
1. 도움말 > 샘플 데이터 폴더를 선택하고 Diabetes.jmp를 엽니다.
2. 그래프 > 그래프 빌더를 선택합니다.
3. HDL을 선택하여 X 영역으로 드래그합니다.
4. Gender를 선택하여 중첩 영역으로 드래그합니다.
5. 히스토그램 요소 아이콘
을 클릭합니다.
6. "히스토그램" 특성 패널의 "히스토그램 스타일" 목록에서 커널 밀도를 선택합니다.
7. 커서가 가로 손 모양으로 바뀔 때까지 Y 축 척도의 맨 위 근처를 커서로 가리킵니다. 클릭한 후 최대값이 약 85가 될 때까지 드래그합니다.
그림 4.24 Gender별 중첩 HDL 히스토그램
히스토그램을 보면 남성(파란색)이 여성(분홍색)보다 HDL 수준이 더 높음을 알 수 있습니다. 파란색 분포는 HDL 척도에서 분홍색 분포보다 오른쪽에 있거나 더 높습니다. 이제 그래프를 변경하여 능선 그림에서 성별의 차이를 확인합니다.
8. Gender를 선택하여 Y 영역으로 드래그합니다.
9. "히스토그램" 특성 패널에서 히스토그램이 겹쳐지도록 "중첩" 슬라이더를 움직입니다(슬라이더가 약 3/4 위로 올라갈 때까지).
10. 완료를 클릭합니다.
11. 범례를 두 번 클릭합니다. "범례 설정" 창에서 "1"을 두 번 클릭하고 male을 입력합니다. "2"를 두 번 클릭하고 "female"을 입력합니다.
12. 확인을 클릭합니다.
팁: 범례의 항목이 강조 표시되어 있으면 해당 항목을 클릭하여 선택 취소합니다.
그림 4.25 HDL 대 Gender 능선 차트
능선 차트에 성별 분포 오프셋이 표시됩니다.