이 예에는 학생 40명의 연령과 키에 대한 데이터가 있습니다. 변수의 분포를 시각화하고 해당 분포에서 이상치를 찾으려고 합니다.
1. 도움말 > 샘플 데이터 폴더를 선택하고 Big Class.jmp를 엽니다.
2. 분석 > 분포를 선택합니다.
3. age 및 height를 선택하고 Y, 열을 클릭합니다.
4. 확인을 클릭합니다.
그림 3.2 분포 플랫폼의 예
히스토그램에서 다음을 확인할 수 있습니다.
• 연령은 균일하게 분포되어 있지 않습니다.
• 키의 경우 극단값(이상치일 수 있음)을 갖는 두 개의 점이 있습니다.
"height" 히스토그램에서 50에 해당하는 막대를 클릭하여 잠재적 이상치를 보다 자세히 확인합니다.
• "age" 히스토그램에서 해당 연령이 강조 표시됩니다. 잠재적 이상치의 연령은 12세입니다.
• 데이터 테이블에서 해당 행이 강조 표시됩니다. 잠재적 이상치의 이름은 Lillie와 Robert입니다.
"height" 히스토그램에서 잠재적 이상치에 라벨을 추가합니다.
1. 두 개의 이상치를 모두 선택합니다.
2. 이상치 중 하나를 마우스 오른쪽 버튼으로 클릭하고 행 라벨을 선택합니다.
데이터 테이블에서 해당 행에 라벨 아이콘이 추가됩니다.
3. 전체 라벨이 표시되도록 상자 그림을 더 넓게 조정합니다.
그림 3.3 라벨이 지정된 잠재적 이상치