K 평균 군집화 플랫폼을 사용하여 여러 변수에 대해 유사한 값을 공유하는 관측값을 그룹화할 수 있습니다. 약 200개 ~ 100,000개의 관측값을 포함하는 큰 데이터 테이블에 k 평균 방법을 사용합니다.
K 평균 군집화 플랫폼에서는 관측값을 분할하는 반복 알고리즘을 사용하여 지정된 수의 군집을 생성합니다. k 평균이라고 하는 이 방법은 군집 중심까지의 거리를 최소화하기 위해 관측값을 군집으로 분할합니다. 군집 수 k를 미리 지정해야 합니다. 그러나 여러 k 값의 결과를 비교하여 데이터에 대한 최적 군집 수를 선택할 수 있습니다.
그림 14.1 3D 행렬도