다변량 방법 > 변수 군집화 > 변수 군집화 플랫폼에 대한 통계 상세 정보
발행일 : 03/10/2025

변수 군집화 플랫폼에 대한 통계 상세 정보

변수 군집화 알고리즘은 더 이상 분할할 수 없을 때까지 반복적으로 변수 군집을 분할하고 변수를 군집에 재할당합니다. 초기 군집은 모든 변수로 구성됩니다. 이 알고리즘은 SAS에서 개발했으며 PROC VARCLUS(SAS Institute Inc. 2023g)에서 구현되었습니다.

참고: 이 알고리즘은 "Y, 열" 목록의 변수에 대해 결측값이 없는 관측값만 사용합니다.

알고리즘의 반복 단계는 다음과 같습니다.

1. 모든 군집에 대해 다음을 수행합니다.

a. 각 군집의 변수에 대한 주성분을 계산합니다.

b. 모든 군집의 두 번째 고유값이 1보다 작으면 알고리즘을 종료합니다.

2. 다음 단계에 따라 두 번째 고유값이 가장 큰(1보다 큼) 군집을 두 개의 새 군집으로 분할합니다.

a. 직교 사각 회전을 사용하여 현재 군집의 변수에 대한 주성분을 회전합니다.

b. 현재 군집에서 첫 번째 회전된 주성분에 대한 상관 제곱이 두 번째 주성분에 대한 상관 제곱보다 높은 변수로 구성된 군집 하나를 정의합니다.

c. 원래 군집의 나머지 변수로 구성된 다른 군집을 정의합니다. 이러한 변수는 두 번째 주성분과 더 높은 상관관계가 있습니다.

d. 두 개의 새 군집에 대한 주성분을 계산합니다.

3. 데이터 집합의 변수를 다른 군집에 할당해야 하는지 여부를 검정합니다. 각 변수에 대해 다음을 수행합니다.

a. 각 군집의 첫 번째 주성분과 변수의 상관 제곱을 계산합니다.

b. 상관 제곱이 가장 큰 변수를 군집에 포함합니다.

참고: 직교 사각 회전은 원시 Quartimax 회전이라고도 합니다. 자세한 내용은 Harris와 Kaiser(1964) 연구 자료에서 확인하십시오.

더 많은 정보를 원하십니까? 질문이 있습니까? JMP 사용자 커뮤니티에서 답변 받기 (community.jmp.com).