다변량 방법 > 주성분 > 주성분 플랫폼 시작
발행일 : 03/10/2025

주성분 플랫폼 시작

분석 > 다변량 방법 > 주성분을 선택하여 주성분 플랫폼을 시작합니다. 다변량 및 3D 산점도 플랫폼을 사용하여 주성분 분석을 사용할 수도 있습니다.

주성분 분석의 예에 설명된 예에서는 Solubility.jmp 샘플 데이터 테이블의 모든 연속형 변수를 사용합니다.

그림 4.3 주성분 시작 창 

Principal Components Launch Window

"열 선택"의 빨간색 삼각형 메뉴에 포함된 옵션에 대한 자세한 내용은 JMP 사용열 필터 메뉴에서 확인하십시오.

Y, 열

성분에 대해 분석할 변수입니다.

Z, 보조 변수

표시할 보조 변수입니다. 보조 변수는 주성분 계산에 포함되지 않으며 포함해도 결과에 영향을 주지 않습니다. 연속형 보조 변수는 적재 그림에 투영되어 해석을 향상시키는 데 사용할 수 있습니다.

가중치

분석의 각 행에 가중치를 할당하는 숫자 값이 포함된 하나의 열을 식별합니다.

참고: "와이드" 및 "희소" 분산 추정 방법에서는 "가중치" 역할이 무시됩니다.

빈도

분석의 각 행에 빈도를 할당하는 숫자 값이 포함된 하나의 열을 식별합니다.

참고: "와이드" 및 "희소" 분산 추정 방법에서는 "빈도" 역할이 무시됩니다.

기준

각 그룹에 대한 개별 분석을 수행할 수 있도록 "기준" 열에 지정된 각 값의 주성분 보고서를 생성합니다.

표준화

각 열의 중심화 및 표준화 여부를 지정합니다. 이 옵션은 주성분을 계산하는 데 사용되는 행렬을 결정합니다.

표준화

각 열을 개별적으로 중심화하고 표준화합니다. 상관 행렬을 기반으로 주성분이 계산됩니다.

비척도화

각 열을 개별적으로 중심화합니다. 공분산 행렬을 기반으로 주성분이 계산됩니다.

비척도화 및 비중심화

비척도화/비중심화 행렬을 기반으로 주성분이 계산됩니다.

방법 유형

데이터 유형을 지정합니다.

기본값

열 수가 500개 미만이거나 행 수보다 적으면 "세로형 데이터"가 "방법 유형"으로 지정됩니다. 열 수가 500개를 초과하거나 행 수보다 많으면 와이드 추정 방법을 권장하는 JMP 경고 창이 표시됩니다. 가로형 데이터 추정 방법을 사용하려면 와이드 방법(빠름)을 클릭하고, 세로형 데이터 추정 방법을 사용하려면 기본 방법(느림)을 클릭합니다.

전통적

공분산 행렬, 상관 행렬 또는 비척도화/비중심화 행렬을 사용하여 주성분을 얻습니다.

고급

특이값 분해를 사용하여 주성분을 얻습니다.

분산 추정

("전통적" 방법 유형을 지정한 경우에만 사용 가능) 상관 계산 방법을 지정합니다. 이러한 방법 중 일부는 결측 데이터를 처리합니다.

기본값

"기본값" 옵션은 "행별", "쌍별" 또는 "REML" 방법을 사용합니다. 해당하는 경우 "와이드" 방법으로 전환할 것을 권장하는 JMP 경고가 표시됩니다.

행별 추정은 결측값이 없는 데이터 테이블에 사용됩니다.

쌍별 추정은 결측값이 있고 열이 10개, 행이 5,000개를 각각 초과하거나 행보다 열이 더 많은 데이터 테이블에 사용됩니다.

REML 추정은 그 외의 경우에 사용됩니다.

REML

REML(제한 최대 가능도) 추정은 결측값이 있는 경우에도 모든 데이터를 사용합니다. 데이터 집합이 크고 결측값이 많은 경우 이 방법을 사용하면 편향 수정 요인 때문에 처리 속도가 느립니다. 따라서 REML은 작은 데이터 집합에 가장 유용합니다. 데이터에 결측 셀이 없으면 REML 및 ML 추정값이 동일하고 표본 공분산 행렬과 같습니다. 결측 셀이 있으면 REML의 분산 및 공분산 추정값이 ML 추정의 추정값보다 덜 편향됩니다. 통계 상세 정보는 REML에서 확인하십시오.

ML

ML(최대 가능도) 추정은 결측값이 있는 경우에도 모든 데이터를 사용합니다. ML 추정값은 빠르게 생성되므로 이 방법은 결측 데이터가 있는 큰 데이터 테이블에 가장 유용합니다.

로버스트

로버스트 추정은 결측값이 있는 경우에도 모든 데이터를 사용합니다. 이 방법은 극단값의 비중을 낮추므로 이상치가 있을 수 있는 데이터 테이블에 유용합니다. 통계 상세 정보는 로버스트에서 확인하십시오.

행별

행별 추정은 각 열 쌍에 대한 Pearson 상관을 계산합니다. 통계 상세 정보는 Pearson 곱적률 상관계수에 대한 통계 상세 정보에서 확인하십시오. 행별 추정에서는 결측값이 있는 관측값을 사용하지 않습니다. 이 방법은 결측 데이터가 있는 관측값을 제외하는 데 유용합니다.

쌍별

쌍별 추정은 결측값이 있는 경우에도 모든 데이터를 사용합니다. 이 분산 추정 방법은 두 열에 대해 결측값이 없는 모든 관측값을 사용하여 각 열 쌍에 대한 Pearson 상관을 계산합니다. 통계 상세 정보는 Pearson 곱적률 상관계수에 대한 통계 상세 정보에서 확인하십시오. 쌍별 추정은 결측값이 있는 데이터 테이블에서 행보다 열이 더 많거나, 열이 10개를 초과하거나, 행이 5,000개를 초과하는 경우에 가장 유용합니다.

"REML", "ML" 또는 "로버스트"를 선택한 경우 데이터 테이블에 행보다 열이 더 많고 결측값이 있으면 JMP에서 "분산 추정"이 "쌍별"로 전환됩니다.

"로버스트"를 선택한 경우 데이터 테이블에 행보다 열이 더 많고 결측값이 없으면 JMP에서 "분산 추정"이 "행별"로 전환됩니다.

데이터 테이블의 열이 500개를 초과하고 행보다 열이 더 많은 경우 원래 선택한 방법에 관계없이 JMP에서 "분산 추정"이 "와이드"로 전환됩니다.

참고: 열이 500개를 초과하고 행보다 열이 더 많은 데이터 테이블의 경우 JMP 경고 창이 표시되어 와이드 추정 방법을 사용하도록 권장합니다. 열 수가 많은 경우 다른 방법을 사용하면 계산 시간이 길어질 수 있기 때문입니다. 와이드 추정 방법으로 전환하려면 와이드 방법(빠름)을 클릭하고, 원래 선택한 방법을 사용하려면 기본 방법(느림)을 클릭합니다.

성분 수

("고급" 방법 유형을 지정한 경우에만 사용 가능) 추정할 성분 수를 지정합니다. 일반적으로 성분 수는 데이터의 차원보다 훨씬 적습니다.

지정됨

절단 SVD 추정 방법을 사용하여 지정된 수의 성분을 추정합니다. 절단 SVD 추정은 결측값이 있는 경우에도 모든 데이터를 사용합니다. 이 추정 방법은 부분 특이값 분해를 기반으로 하는 알고리즘을 사용하여 첫 번째 지정한 수의 특이값과 특이값 벡터만 계산합니다. 이 알고리즘은 공분산 행렬 및 불필요한 주성분을 계산하지 않으므로 계산이 효율적입니다. 데이터가 희소할 때, 즉 0이 많이 포함되거나 데이터에 열이 많은 경우에 유용합니다. 통계 상세 정보는 절단 SVD에서 확인하십시오.

참고:JMP 17 이전에는 "희소" 추정 방법으로 알려졌습니다.

모두

완전 SVD 추정 방법을 사용하여 모든 성분을 추정합니다. 완전 SVD 추정은 결측값이 있는 관측값을 사용하지 않으므로 결측 셀이 포함된 행이 제외됩니다. 이 추정 방법은 전체 특이값 분해를 기반으로 하는 알고리즘을 사용합니다. 이 알고리즘은 공분산 행렬을 계산하지 않으므로 계산이 효율적입니다. 데이터에 열이 매우 많은 경우에 유용합니다. 통계 상세 정보는 완전 SVD에서 확인하십시오.

참고:JMP 17 이전에는 "와이드" 추정 방법으로 알려졌습니다.

결측값 대치

("고급" 방법 유형을 지정한 경우에만 사용 가능) 행렬 완성을 통해 결측값을 대치합니다.

특수 방법

("고급" 방법 유형을 지정하고, 추정할 성분 수가 지정된 경우에만 사용 가능) 지정된 수의 성분을 계산하기 위한 추가 방법을 제공합니다.

빠른 근사

랜덤화 특이값 분해를 사용하여 지정된 수의 성분을 추정합니다. 자세한 내용은 랜덤화 SVD에서 확인하십시오.

로버스트 PCA

데이터 행렬 분해를 위해 특이값 분해 및 임계 지정 단계를 순차적으로 사용하여 지정된 수의 성분을 추정합니다. 이 방법은 이상치 탐색 플랫폼에서도 사용됩니다. 로버스트 PCA 방법에 대한 자세한 내용은 예측 및 전문 모델링로버스트 PCA 이상치에서 확인하십시오.

Image shown here비음 주성분

행렬 분해에 비음성 제약 조건을 적용하여 지정된 수의 성분을 추정합니다. 이로 인해 음수가 아닌 적재 및 스코어가 생성됩니다. 성분은 한 번에 하나씩 추출되는 것이 아니라 동시에 추출됩니다.

참고:비음 주성분 방법은 데이터가 음수가 아니라고 가정합니다. 데이터를 음수가 아닌 상태로 유지하기 위해 중심화도 허용되지 않습니다. 따라서 "표준화"를 선택하면 열이 개별적으로 척도화되지만 중심화되지는 않습니다.

Image shown here희소 성분 분석

희소하거나 대부분 0이 포함된 적재를 생성하는 행렬 분해를 사용하여 지정된 수의 성분을 추정합니다. 행렬 분해는 한 번에 하나씩 수행되는 것이 아니라 동시에 수행됩니다. 이 방법은 Varimax 회전과 비슷합니다. 자세한 내용은 Chen & Rohe(2023)에서 확인하십시오.

참고:결측값이 있으면 희소 성분 분석 알고리즘을 반복할 때마다 데이터 결측값 대치가 수행됩니다. 분해의 이전 반복에서 다시 생성된 값으로 결측값이 대체됩니다.

결측 데이터

주성분 플랫폼에서 결측 데이터를 처리하는 방법은 분산 추정 방법에 따라 달라집니다. 다음과 같은 방법으로 플랫폼 외부에서 결측값을 추정할 수도 있습니다.

다변량 방법 > 다변량 아래에 있는 "결측 데이터 대치" 옵션을 사용합니다. 자세한 내용은 결측 데이터 대치에서 확인하십시오.

분석 > 선별 > 결측값 탐색에 있는 "다변량 정규 대치법" 또는 "다변량 SVD 대치법" 유틸리티를 사용합니다. 자세한 내용은 예측 및 전문 모델링결측값 탐색에서 확인하십시오.

더 많은 정보를 원하십니까? 질문이 있습니까? JMP 사용자 커뮤니티에서 답변 받기 (community.jmp.com).