다변량 방법 > K 평균 군집화 > K 평균 보고서 > K 평균 군집 수 보고서
발행일 : 03/10/2025

K 평균 군집 수 보고서

K 평균 군집화 플랫폼의 각 "K 평균 군집 수" 보고서에는 각 군집에 대한 다음과 같은 요약 통계량이 제공됩니다.

"군집 요약" 보고서에는 군집 수와 각 군집의 관측값 수 및 필요한 반복 수가 제공됩니다.

"군집 평균" 보고서에는 각 군집에서 각 변수에 대한 관측값의 평균이 제공됩니다.

"군집 표준편차" 보고서에는 각 군집에서 각 변수에 대한 관측값의 표준편차가 제공됩니다.

K 평균 군집 수 보고서 옵션

각 "K 평균 군집 수" 보고서에는 다음과 같은 빨간색 삼각형 메뉴 옵션이 있습니다.

행렬도

데이터의 처음 두 주성분으로 표현된 점 및 군집의 그림을 군집 색상을 식별하는 범례와 함께 표시합니다. 군집 중심을 기준으로 원이 그려지고 원 크기는 군집 내의 개수에 비례합니다. 음영 영역은 평균 주위의 밀도 등고선입니다. 기본적으로 이 영역은 해당 군집의 관측값 중 90%가 속하는 위치를 나타냅니다(Mardia et al. 1980 참조). 그림 아래의 목록을 사용하여 그림 축을 다른 주성분으로 변경할 수 있습니다. 또는 화살표 버튼을 사용하여 가능한 모든 축 조합을 순환할 수 있습니다. 군집 색상을 데이터 테이블에 저장하는 옵션도 그림 아래에 있습니다. 자세한 내용은 테이블에 색상 저장에서 확인하십시오. 고유값은 내림차순으로 표시됩니다.

참고: 시작 창에서 "개별적으로 척도화된 열"을 선택한 경우 행렬도에 상관 행렬이 사용됩니다. "개별적으로 척도화된 열"을 선택하지 않은 경우에는 행렬도에 공분산 행렬이 사용됩니다.

행렬도 옵션

행렬도 모양을 제어하기 위한 다음 옵션을 포함합니다.

행렬도 선 표시

행렬도 선을 표시합니다. 라벨이 지정된 선은 주성분으로 정의된 부분 공간에서 공변량의 방향을 표시합니다. 이러한 선은 각 변수와 각 주성분의 연관성 정도를 나타냅니다.

행렬도 선 위치

행렬도 선의 위치와 반지름 척도를 지정할 수 있습니다. 기본적으로 선은 점 (0,0)에서 시작됩니다. 그림에서 선을 드래그하거나 이 옵션을 사용하여 좌표를 지정할 수 있습니다. 반지름 척도 옵션을 사용하여 선이 더 잘 보이게 선 척도를 조정할 수도 있습니다.

행렬도 등고선 밀도

밀도 등고선에 대한 신뢰 수준을 지정할 수 있습니다. 기본 신뢰 수준은 90%입니다.

군집 표시

데이터 테이블의 행에 군집을 식별하는 표식을 할당합니다.

행렬도 3D

데이터의 3차원 행렬도를 표시합니다. 변수가 세 개 이상인 경우에만 사용할 수 있습니다.

평행 좌표 그림

각 군집에 대한 평행 좌표 그림을 생성합니다. 이 그림 보고서에는 데이터와 평균을 표시하거나 숨기는 옵션이 있습니다. 자세한 내용은 그래프 분석평행 그림에서 확인하십시오.

산점도 행렬

모든 Y 변수를 사용하여 산점도 행렬을 표시하거나 숨깁니다. 각 산점도에는 현재 군집 수를 기반으로 하는 밀도 타원이 포함되어 있습니다.

SOM 히트맵

(자기 조직화 지도에만 사용 가능) 군집화에 사용된 Y 변수 중 하나로 색상이 지정된 SOM 군집 평균의 히트맵을 표시하거나 숨깁니다. "히트맵에 적용할 색상 열 선택" 옆의 메뉴를 사용하여 Y 변수를 변경합니다.

참고: 히트맵의 군집은 위에서 아래로, 오른쪽에서 왼쪽으로 배치되어 구성됩니다. 즉, 첫 번째 군집은 오른쪽 상단 모서리에 있고 마지막 군집은 왼쪽 하단 모서리에 있습니다.

테이블에 색상 저장

데이터 테이블의 행에 군집을 식별하는 색상을 할당합니다. 보고서 창에 "행렬도"가 있는 경우 데이터 테이블에 저장된 색상은 행렬도의 군집 색상과 일치합니다. "행렬도"에서 색상을 변경하고 "테이블에 색상 저장" 옵션을 다시 선택하면 테이블의 색상이 행렬도의 색상과 일치하도록 업데이트됩니다.

참고: 저장 옵션을 선택하면 저장된 각 열에 해당 특정 열의 데이터에 대한 군집 수를 지정하는 "노트" 열 특성이 포함됩니다. 이렇게 하면 둘 이상의 군집 적합에서 열을 저장하고 열 특성을 사용하여 저장된 열을 가져온 군집화 적합을 식별할 수 있습니다.

군집 저장

다음 두 열을 데이터 테이블에 저장합니다.

군집 열은 주어진 행이 할당된 군집의 번호를 포함합니다.

(자기 조직화 지도에는 사용 불가능) 거리 열은 주어진 관측값과 군집 평균 사이의 유클리드 거리 제곱을 포함합니다. 각 변수에 대해 관측값과 해당 변수의 군집 평균 간의 차이를 변수의 전체 표준편차로 나눕니다. 변수 전체에 대해 이러한 척도화된 차이의 제곱합이 계산됩니다.

군집 거리 저장

(자기 조직화 지도에는 사용 불가능) 거리 열을 데이터 테이블에 저장합니다. 이 열은 군집 저장 옵션에서 얻은 거리 열과 동일합니다.

SOM 격자 저장

(자기 조직화 지도에만 사용 가능) 새 열을 데이터 테이블에 저장합니다. 새 열에는 각 관측값에 대해 최대 확률 분류 군집의 SOM 격자 행 및 열 번호가 포함됩니다.

군집 계산식 저장

"군집 계산식"이라는 계산식 열을 데이터 테이블에 저장합니다. 이 계산식은 각 소속 군집을 식별합니다.

거리 계산식 저장

(자기 조직화 지도에는 사용 불가능) "거리 계산식"이라는 계산식 열을 데이터 테이블에 저장합니다. 이 계산식은 할당된 군집까지의 거리를 계산합니다.

K 군집 거리 저장

(자기 조직화 지도에는 사용 불가능) 각 군집 중심까지의 유클리드 거리 제곱을 포함하는 k개 열을 저장합니다.

K 거리 계산식 저장

(자기 조직화 지도에는 사용 불가능) 각 군집 중심까지의 유클리드 거리 제곱 계산식을 포함하는 k개 열을 저장합니다.

군집 계산식 게시

"군집 계산식 저장" 옵션에 사용된 것과 동일한 스코어링 코드를 "계산식 저장소"에 게시합니다.

군집 시뮬레이션

군집 평균 및 표준편차를 사용하여 Y 변수에 대한 시뮬레이션된 군집 관측값을 포함하는 새 데이터 테이블을 생성합니다.

제거

군집화 보고서를 제거합니다.

더 많은 정보를 원하십니까? 질문이 있습니까? JMP 사용자 커뮤니티에서 답변 받기 (community.jmp.com).