예측 및 전문 모델링 > 이상치 탐색 > 이상치 탐색 보고서 > 로버스트 PCA 이상치 보고서
발행일 : 03/10/2025

로버스트 PCA 이상치 보고서

이상치 탐색 플랫폼의 "로버스트 PCA 이상치" 보고서에는 알고리즘에 대한 정보 테이블과 여러 결과 테이블이 포함되어 있습니다. 초기 테이블에는 낮은 계수 행렬의 계수, SVD 반복 수, 수렴 기준, 람다 값 및 대치된 결측값 수가 포함됩니다. "랜덤화 SVD" 옵션이 활성화된 경우에는 "랜덤화 SVD" 옵션에 사용되는 차원 수도 요약 테이블에 포함됩니다. 다음은 보고서에 포함되는 다른 테이블입니다.

큰 잔차 셀

열 이름과 행 번호로 식별되는 가장 큰 이상치 관측값을 보여 주는 테이블입니다. 표시되는 관측값 수는 이상치 임계값에 의해 결정됩니다. 이 테이블에는 관측값의 열 이름과 행 번호, 잔차 값 및 척도화된 잔차 값이 포함됩니다.

팁: 데이터 테이블의 특정 이상치 셀에 색상을 적용하려면 "큰 잔차 셀" 테이블에서 행을 선택하고 색상 지정을 클릭합니다.

행 제곱근 평균 제곱

데이터 테이블의 각 행에 대한 제곱근 평균 제곱 값을 보여 주는 테이블입니다. 제곱근 평균 제곱은 척도화된 잔차를 사용하여 계산됩니다.

팁: "행 제곱근 평균 제곱" 테이블에서 행을 선택하면 데이터 테이블에서 해당 행이 선택됩니다.

열 제곱근 평균 제곱

시작 창에 지정된 각 열에 대한 제곱근 평균 제곱 값을 보여 주는 테이블입니다. 제곱근 평균 제곱은 척도화된 잔차를 사용하여 계산됩니다.

팁: "열 제곱근 평균 제곱" 테이블에서 행을 선택하고 열 선택을 클릭하면 데이터 테이블에서 해당 열이 선택됩니다.

스냅샷

데이터 테이블에 있는 이상치 셀의 그래픽 표현입니다. 이상치 셀은 빨간색으로 표시됩니다.

잔차

행렬 분해의 잔차 행렬입니다. 척도화된 잔차의 절대값이 다음 값보다 크면 셀에 색상이 적용됩니다.

min[0.99 ´ max{abs(residuals)}, 이상치 임계값]

낮은 계수 근사

행렬 분해의 척도화된 잔차 행렬입니다.

특이값

SVD의 특이값 벡터입니다.

로버스트 PCA 이상치 옵션

"로버스트 PCA 이상치" 보고서 아래쪽에 보고서의 각 항목을 저장하는 옵션을 제공하는 버튼이 있습니다.

닫기

"로버스트 PCA 이상치" 보고서를 닫습니다.

큰 이상치 저장

"큰 잔차 셀" 테이블의 정보를 새 데이터 테이블에 저장합니다.

정리된 항목 저장

임계값을 기반으로 이상치를 정리하고 새 열을 데이터 테이블에 저장하는 몇 가지 기법을 제공하는 창을 엽니다.

절사

해당하는 척도화된 절대 잔차가 지정된 임계값보다 크면 이상치 셀을 제거합니다. 기본적으로 임계값은 10입니다. 이상치 셀을 빨간색으로 표시하려면 "색상 Image shown here"을 선택합니다. 절사 셀은 비척도화 임계값으로 설정됩니다.

결측값 대치

해당하는 척도화된 절대 잔차가 지정된 임계값보다 크면 이상치 셀을 낮은 계수 근사의 값으로 설정합니다. 기본적으로 임계값은 100입니다. 해당 셀을 녹색으로 표시하려면 "색상 Image shown here"을 선택합니다.

결측값 생성

해당하는 척도화된 절대 잔차가 지정된 임계값보다 크면 이상치 셀을 결측으로 설정합니다. 기본적으로 임계값은 1000입니다. 해당 셀을 파란색으로 표시하려면 "색상 Image shown here"을 선택합니다.

결측값의 대치된 값 색상 적용 Image shown here

이 옵션을 선택하면 원래 있던 결측값이 대치된 셀에 색상을 적용합니다.

잔차 저장

잔차를 원래 데이터 테이블의 새 열에 저장합니다.

척도화된 잔차 저장

척도화된 잔차를 원래 데이터 테이블의 새 열에 저장합니다.

낮은 계수 근사 저장

낮은 계수 근사를 원래 데이터 테이블의 새 열에 저장합니다.

더 많은 정보를 원하십니까? 질문이 있습니까? JMP 사용자 커뮤니티에서 답변 받기 (community.jmp.com).