다변량 방법 > K 평균 군집화 > K 평균 군집화 플랫폼 개요
발행일 : 03/10/2025

K 평균 군집화 플랫폼 개요

K 평균 군집화 플랫폼에서는 반복 적합 프로세스를 사용하여 지정된 수의 군집을 형성합니다. k 평균 알고리즘은 먼저 군집 시드라고 하는 k개의 점 집합을 군집 평균의 초기 추측 값으로 선택합니다. 각 관측값은 가장 가까운 군집 시드에 할당되어 임시 군집 집합을 형성합니다. 그런 다음 시드가 군집 평균으로 대체되고 점이 재할당되며 군집에서 더 이상 변화가 없을 때까지 프로세스가 계속됩니다.

k 평균 알고리즘은 EM 알고리즘의 특수한 경우로, 여기서 E는 기대(Expectation), M은 최대화(Maximization)를 나타냅니다. k 평균 알고리즘의 경우 임시 군집 평균의 계산은 기대 단계를 나타내고 가장 가까운 군집에 점을 할당하는 것은 최대화 단계를 나타냅니다.

K 평균 군집화는 숫자 열만 지원합니다. K 평균 군집화는 모델링 유형(명목형 및 순서형)을 무시하고 모든 숫자 열을 연속형으로 처리합니다.

군집 수 k 또는 k 값 범위를 미리 지정해야 합니다. 그러나 여러 k 값의 결과를 비교하여 데이터에 대한 최적 군집 수를 선택할 수 있습니다.

K 평균 군집화에 대한 배경 정보는 SAS Institute Inc. (2023d)의 "FASTCLUS Procedure" 장 및 Hastie et al. (2009)에서 확인하십시오.

K 평균 군집화는 JMP에서 관측값을 군집화하기 위해 제공하는 네 가지 플랫폼 중 하나입니다. 네 가지 방법을 모두 비교하려면 관측값 군집화 플랫폼 개요의 내용을 참조하십시오.

더 많은 정보를 원하십니까? 질문이 있습니까? JMP 사용자 커뮤니티에서 답변 받기 (community.jmp.com).