"다변량" 빨간색 삼각형 메뉴의 "이상치 분석" 옵션에는 이상치 감지에 사용할 세 가지 거리 측도의 하위 메뉴가 포함되어 있습니다. 하위 메뉴의 각 옵션은 상관 구조와 관련하여 다변량 관점에서 거리를 측정하는 그림을 표시하거나 숨깁니다. 그림 아래쪽에 표시된 유의 수준으로 검정이 수행됩니다.
Figure 3.5에서 점 A는 좌표 방향에서는 이상치가 아니지만 상관 구조를 벗어나므로 이상치입니다.
그림 3.5 이상치의 예
다음과 같은 거리 측도 옵션을 사용할 수 있습니다.
Mahalanobis 거리
다변량 평균(중심)과 각 점 사이의 Mahalanobis 거리를 표시하거나 숨깁니다. 표준 Mahalanobis 거리는 데이터의 평균, 표준편차 및 상관관계 추정값에 따라 달라집니다. 각 관측값 번호에 대해 거리가 표시됩니다. 거리 값이 가장 큰 점을 강조 표시하여 극단 다변량 이상치를 식별할 수 있습니다. 자세한 내용은 Mahalanobis 거리 측도에서 확인하십시오.
잭나이프 거리
잭나이프 기법을 사용하여 계산된 거리를 표시하거나 숨깁니다. 각 관측값의 거리는 관측값 자체를 포함하지 않는 평균, 표준편차 및 상관 행렬의 추정값을 사용하여 계산됩니다. 잭나이프 거리는 이상치가 있을 때 유용합니다. 이 경우 Mahalanobis 거리는 왜곡되어 이상치를 감추거나 다른 점이 이상치보다 더 멀리 보이게 하는 경향이 있습니다. 자세한 내용은 잭나이프 거리 측도에서 확인하십시오.
T2
Mahalanobis 거리의 제곱인 거리를 표시하거나 숨깁니다. 이 그림은 다변량 관리도에서 선호됩니다. 계산된 T2 통계량 값과 관리 상한이 그림에 포함됩니다. 이 한계를 벗어나는 값은 이상치일 수 있습니다. 자세한 내용은 T2 거리 측도에서 확인하십시오.
그림 3.6 이상치 분석 그림
그림의 빨간색 삼각형 메뉴에서 저장 옵션을 선택하여 거리를 데이터 테이블에 저장할 수 있습니다.
참고: 잭나이프 거리 열에는 계산식이 저장되지 않습니다. 즉, 데이터 테이블을 수정해도 거리가 다시 계산되지 않습니다. 열을 추가 또는 삭제하거나 데이터 테이블의 값을 변경하는 경우 분석 > 다변량 방법 > 다변량을 다시 선택하여 새 잭나이프 거리를 계산해야 합니다.
각 행의 거리 값을 저장하는 것 외에도 지정된 이상치 분석 유형에 대한 UCL(관리 상한) 값을 포함하는 열 특성이 생성됩니다.