분포 플랫폼의 "이상치 상자 그림" 옵션을 사용하여 분포를 확인하고 가능한 이상치를 식별할 수 있습니다. 일반적으로 상자 그림에는 연속형 분포 중 선택된 분위수가 표시됩니다. 이상치 상자 그림은 행 수가 100,000개 미만일 때 기본적으로 나타납니다. 환경 설정 > 플랫폼 > 분포에서 "이상치 상자 그림 행 경계" 플랫폼 환경 설정을 사용하여 이 임계값을 설정할 수 있습니다.
참고: 이상치 상자 그림을 Tukey 이상치 상자 그림 또는 도식 상자 그림이라고도 합니다.
그림 3.8 이상치 상자 그림
이상치 상자 그림의 경우 다음 사항에 유의하십시오.
• 상자 내의 가로 선은 표본 중앙값을 나타냅니다.
• 신뢰 다이아몬드에는 평균과 평균의 95% 상한 및 하한이 포함됩니다. 다이아몬드의 중앙을 지나는 선을 그리면 평균을 알 수 있습니다. 다이아몬드의 위쪽 및 아래쪽 점은 평균의 95% 상한 및 하한을 나타냅니다.
• 상자의 끝은 25번째 및 75번째 분위수를 나타내며 각각 1사분위수 및 3사분위수라고도 합니다.
• 1사분위수와 3사분위수 사이의 차이를 사분위수 범위.라고 합니다.
• 상자에는 양 끝에서 시작되는 선이 있으며 이 선은 수염이라고도 합니다. 수염은 상자 끝에서 시작해서 다음과 같이 계산된 거리 내에 있는 점들 중 가장 바깥쪽 데이터 점까지 이어집니다.
1사분위수 - 1.5 * (사분위수 범위)
3사분위수 + 1.5 * (사분위수 범위)
데이터 점이 계산된 범위에 포함되지 않으면 상한 및 하한 데이터 점 값(이상치 제외)에 따라 수염이 결정됩니다.
• 상자 외부의 괄호는 관측값 중 밀도가 가장 높은 50%에 해당하는 최단 절반을 나타냅니다(Rousseeuw and Leroy 1987).
• 이상치 상자 그림에서 개체를 제거하는 방법은 이상치 또는 분위수 상자 그림에서 개체 제거에서 확인하십시오.