그래프 빌더에서 등고선 요소
는 밀도 영역 또는 값 등고선(색상 변수와 함께 사용되는 경우)을 표시합니다. 밀도 등고선은 점이 많은 산점도에서 다량의 점으로 인해 밀도 패턴을 파악하기 어려운 경우에 유용합니다. 여러 등고선 유형을 사용할 수 있습니다. 기본값은 데이터 점의 밀도를 반영하도록 적합된 평활 이변량 비모수 밀도 표면입니다. 비모수 밀도 표면은 각 점에서 이변량 확률 밀도 함수를 추정하여 연속형 이변량 히스토그램 형태를 제공합니다.
• 두 개의 연속형 변수에 대해 기본적으로 네 개의 등고선이 표시됩니다. 이러한 등고선은 100%, 75%, 50% 및 25% 밀도 등고선입니다. 표시할 등고선 수준의 수를 지정할 수 있습니다. 가방 그림 또는 HDR(고밀도 영역) 등고선을 선택할 수도 있습니다.
• 연속형 변수가 하나뿐인 경우 등고선 그림 대신 바이올린 그림이 나타납니다. 바이올린 그림은 공통 세로 축을 중심으로 대칭 커널 밀도를 표시하여 데이터 밀도를 보여 줍니다. 커널 밀도는 각 점에서 확률 밀도 함수를 추정하여 연속형 히스토그램 형태를 제공합니다. 바이올린 그림은 대칭 커널 밀도가 상자와 수염을 대체하는 상자 그림과 비슷합니다. HDR(고밀도 영역) 등고선을 선택할 수도 있습니다.
• 등고선 그림에 색상 변수를 추가하면 색상 변수의 수준을 반영하는 값 등고선이 그림에 표시됩니다. 값 등고선은 Delaunay 삼각 분할을 사용하여 계산됩니다. "변환" 옵션을 선택하여 X 및 Y 범위가 정규화된 그림을 표시할 수 있습니다.
그림 3.29 등고선 그림 또는 바이올린 그림의 등고선 옵션
채우기
(가방 그림에는 사용 불가능) 등고선을 채웁니다.
선
(가방 그림에는 사용 불가능) 등고선 주위에 선을 추가합니다.
수준 수
(비모수 밀도에 사용 가능) 밀도 등고선의 경우 표시되는 등고선 수를 지정합니다. 1에서 1000 사이의 숫자를 지정할 수 있으며 기본값은 4개의 등고선입니다.
경계
(색상 변수가 있는 경우에만 사용 가능) 등고선의 외부 경계 주위에 선을 추가합니다.
알파
(색상 변수가 있는 경우에만 사용 가능) 값 등고선의 윤곽을 제어합니다. 알파를 늘리면 높이가 길고 가는 삼각형 또는 큰 삼각형 중 일부를 제거할 수 있으며 이 경우 보간이 적절하지 않을 수 있습니다.
평활도
(가방 그림에는 사용 불가능) 등고선 그림의 경계를 평활화합니다. 평활도 값은 -1과 1 사이에서 정규화됩니다. 이 값은 평활 커널 반지름으로 해석할 수 있습니다. 원래 데이터는 격자에 보간된 후 가우시안 평활기가 적용됩니다.
변환
(색상 변수가 있는 경우에만 사용 가능) "정규 범위"를 선택하여 삼각 분할을 X와 Y에 대해 정규화된 척도를 사용하도록 변환합니다. 이렇게 하면 Delaunay 삼각 분할을 계산하기 전에 X 값과 Y 값이 모두 [0,1]로 척도화됩니다. 이 옵션은 X 단위와 Y 단위가 매우 다른 경우에 적합할 수 있습니다. 이러한 경우 점이 여러 차원 중 한 차원에서만 이어지면 Delaunay 삼각 분할은 높이가 길고 가는 삼각형을 최소화하려고 하므로 일부 피처가 잘 보이지 않을 수 있습니다.
등고선 유형
등고선 유형을 선택할 수 있습니다.
비모수 밀도
(이변량 그림에만 사용 가능) 평활 이변량 비모수 밀도 표면입니다.
가방 그림
이변량 상자 그림이라고도 하는 가방 그림을 그립니다. 가방 그림은 두 개의 다각형, 이상치 점 집합 및 중앙값 점으로 구성됩니다. 모든 계산은 데이터에서 각 점에 대한 Tukey 깊이(이변량 깊이)의 첫 번째 계산을 기반으로 합니다. 중앙값 점은 최대 깊이에서 모든 점의 평균이며 별표로 표시됩니다. 내부 다각형은 최대 50%의 데이터 점을 포함하는 가방입니다. 그림에 표시되지 않은 울타리는 중앙값 점에 대해 3배 부풀려진 가방 다각형입니다. 외부 다각형은 울타리 내에 포함된 모든 점의 최소볼록집합입니다. 이를 루프라고 합니다. 울타리 외부의 점은 이상치로 지정되고 그림에 점으로 표시됩니다. 가방 그림에 대한 자세한 내용은 Rousseeuw(1999)에서 확인하십시오.
HDR
단변량 데이터에 대한 최고 밀도 영역 직사각형과 이변량 데이터에 대한 등고선을 그립니다. 밝은 음영 영역은 99% 확률 영역을 나타내고 어두운 음영 영역은 50% 확률 영역을 나타냅니다. 영역은 인접하지 않을 수 있으며 입력 데이터의 정확히 50% 또는 99%가 포함되지 않을 수 있습니다. 50% 확률 영역 내의 밀도 최빈값은 선(단변량 데이터) 또는 별표(이변량 데이터)로 나타납니다. 그림에서 점을 제거하면 남아 있는 점은 99% 확률 영역에 대한 이상치를 나타냅니다. "평활도" 옵션을 사용하여 영역의 평활도를 조정할 수 있습니다.
HDR 영역은 점이 격자에 보간된 후 데이터에 가우시안 커널을 적용하여 추정된 비모수 밀도를 기반으로 합니다. HDR 영역의 평활도를 결정하기 위한 기본 대역폭은 다음과 같이 계산됩니다.

생성된 등간격 계급을 사용하여 밀도 영역을 계산합니다. 등고선은 공간을 등확률 영역으로 구분하는 밀도 영역 내에서 균등한 간격으로 배치됩니다. 최고 밀도 영역에 대한 자세한 내용은 Hyndman(1996)에서 확인하십시오.
바이올린
(단변량 그림에만 사용 가능) 공통 세로 축을 중심으로 대칭 커널 밀도를 표시하여 데이터 밀도의 바이올린 그림을 그립니다. 밀도는 HDR 영역과 동일한 절차를 사용하여 정의됩니다.
지터
지터를 설정하거나 해제합니다. 지터는 데이터에 랜덤 잡음을 추가하고 과다 표시를 줄이는 데 도움이 될 수 있습니다. 특정 지터 옵션에 대한 설명은 점에서 확인하십시오.
이상치
(가방 그림 및 HDR 등고선에 사용 가능) 이상치를 표시합니다.
바이올린 척도
여러 바이올린 그림의 경우 척도 옵션을 선택합니다. "동일 영역" 또는 "동일 너비"는 바이올린의 영역 또는 최대 너비가 같다는 의미입니다. "가중 영역"은 바이올린의 영역이 각 바이올린의 관측값 수에 비례한다는 의미입니다.
변수
변수의 그래프 요소를 표시하거나 숨기고, 변수 표시를 재정렬합니다.
참고: 이러한 옵션은 "그룹 X", "그룹 Y", "펼침" 또는 "페이지" 영역의 변수에는 적용되지 않습니다.
체크박스 다음에 영역 지정 및 변수 이름이 나옵니다. 체크박스를 사용하여 다음을 수행할 수 있습니다.
– 영역의 변수에 해당하는 요소를 표시하거나 숨깁니다.
– 영역의 변수에 색상, 크기, 셰이프 또는 빈도 변수를 적용하는 효과를 추가하거나 제거합니다.
팁: 그래프가 여러 개인 경우 서로 다른 변수로 각 그래프에 색상을 적용하거나 크기를 조정할 수 있습니다. 두 번째 변수를 색상 또는 크기 영역으로 드래그하여 모서리에 놓습니다. "변수" 옵션에서 각 그래프에 적용할 특정 색상 또는 크기 변수를 선택합니다.
영역에 여러 변수가 있는 경우 화살표를 사용하여 표시를 재정렬합니다. 변수 이름을 강조 표시하고 화살표를 클릭하여 위치를 조정할 수 있습니다.
"변수"의 사용 예는 영역 차트와 선 차트의 예에서 확인하십시오.
축 척도에 맞춤
로그 및 기타 축 변환의 경우 변환된 좌표에 계산을 적용합니다.
등고선 배치
(그룹화 변수와 함께 사용 가능) 등고선을 정렬하거나 오프셋할 수 있습니다.