예측 및 전문 모델링 > 이상치 탐색 > 이상치 탐색 플랫폼의 추가 예
발행일 : 03/10/2025

이상치 탐색 플랫폼의 추가 예

로버스트 PCA 이상치 방법을 사용하여 도시 폐수 처리장의 데이터에서 잠재적 이상치를 탐색합니다. 잠재적 이상치에는 센서 고장, 악천후 및 기타 상황이 포함될 수 있습니다.

1. 도움말 > 샘플 데이터 폴더를 선택하고 Water Treatment.jmp를 엽니다.

2. 분석 > 선별 > 이상치 탐색을 선택합니다.

3. Sensor Measurements 열 그룹을 선택하고 Y, 열을 클릭합니다.

4. 확인을 클릭합니다.

5. Shift 키를 누른 채 로버스트 PCA 이상치를 클릭합니다.

6. "이상치 임계값" 옆에 "10"을 입력합니다.

다른 옵션에는 기본값을 사용합니다.

7. 확인을 클릭합니다.

그림 21.8 로버스트 PCA 이상치 보고서 

Robust PCA Outliers Report

"큰 잔차 셀" 테이블에는 척도화된 잔차가 10보다 크거나 -10보다 작은 셀이 표시됩니다. SED-S 열에 척도화된 잔차가 큰 셀이 여러 개 있습니다. "열 제곱근 평균 제곱" 테이블을 살펴보면 실제로 SED-S 열의 제곱근 평균 제곱 척도 값이 가장 크다는 것을 알 수 있습니다. 제곱근 평균 제곱 척도 값이 가장 큰 행은 60행입니다.

8. 보고서 맨 아래에서 정리된 항목 저장을 클릭합니다.

이 옵션을 사용하면 값을 절사하고, 새 값을 대치하거나, 셀을 결측으로 설정하여 이상치가 큰 셀을 조정할 수 있습니다. "정리된 열 저장" 보고서에 이러한 옵션이 제공됩니다.

9. "결측값 대치"를 선택합니다. "절사"는 기본적으로 선택되어 있습니다.

10. 확인을 클릭합니다.

Water Treatment.jmp 데이터 테이블에 38개의 "정리됨" 열이 새로 추가되었습니다. 60행의 제곱근 평균 제곱 척도 값이 가장 크다는 것을 알고 있으므로 이 행으로 스크롤하여 절사 및 결측값 대치된 일부 셀을 확인합니다. 이제 모든 유형의 분석에서 정리된 열을 사용할 수 있습니다.

그림 21.9 로버스트 PCA 이상치의 정리된 열 

Cleaned Columns from Robust PCA Outliers

더 많은 정보를 원하십니까? 질문이 있습니까? JMP 사용자 커뮤니티에서 답변 받기 (community.jmp.com).