파이 차트

파이 차트

파이 차트는 한 변수에 대한 전체 대비 부문별 구성비를 보여줍니다.

파이 차트의 활용

파이 차트는 전체 대비 부문별 구성비를 파악하는 데 도움이 됩니다. 파이 차트는 여러 상황에서 종종 사용되는데, 막대 차트 또는 선 그래프가 더 적합할 수 있는 경우에 활용되기도 합니다.

고려할 몇 가지 문제점

파이 차트는 명목형 또는 범주형 데이터에 사용됩니다. 변수에 다양한 수준이 있는 경우, 막대 차트나 팩형 막대 차트를 이용한 데이터 시각화 결과가 더 유용할 수 있습니다.

전체 대비 부문별 구성비를 보여주는 파이 차트

파이 차트는 하나의 원을 여러 영역 또는 조각으로 나눈 원그래프입니다. 각 조각은 해당 변수에 대한 한 수준의 관측치 개수 또는 백분율을 나타냅니다. 파이 차트는 대개 기업에서 활용합니다. 고객 유형별 백분율, 다양한 제품별 매출 백분율, 다양한 국가별 수익 등을 보여주는 차트를 예로 들 수 있습니다. 파이 차트는 개수가 적을 때 전체 대비 여러 구성 요소 간 관계를 표시하는 데 유용합니다. 예를 들어, 그림 1에서 보듯이 한 제품의 여러 브랜드별 매출 기여도를 보여주는 파이 차트는 기업에 유용할 수 있습니다.

그림 1: 변수가 4개인 파이 차트

그림 1의 파이 차트는 매출의 거의 절반이 나머지 제품군보다 매출액 비율이 높은 Salon 제품군에서 비롯되었음을 보여줍니다. Budget 제품군의 매출액 비율이 가장 낮습니다. 파이 차트를 통해 전체 대비 부문별 구성비에 초점을 맞추려고 합니다.

파이 차트는 위에 나온 기본적인 2차원 예제로 사용하기에 가장 좋습니다. 3차원 파이 차트를 사용하면 종종 혼란이 가중되므로 권장하지 않습니다. 3D 영역에는 시각적으로 해석할 다른 차트 기능만 추가될 뿐, 데이터에 대한 추가 정보가 더해지지는 않습니다.

파이 차트 예제

예제 1: 기본 파이 차트

그림 2는 타이타닉호 승객들의 객석 등급에 대한 파이 차트를 보여줍니다. 승객의 절반 이상이 3등석 티켓 보유자임을 확인하는 것이 목표입니다. 나머지 승객들은 1등석과 2등석 티켓 사이에 거의 고르게 나뉘어져 있습니다. 특정 백분율이 아닌 전체 대비 객석 등급별 비율에 초점을 맞추는 것이 목표입니다.

예제 2: 기본 파이 차트

예제 2: 유사한 값들을 보여주는 막대 차트

전체 대비 부분별 구성비 값이 매우 유사할 때는 파이 차트가 가장 적합한 그래프가 아닙니다. 그림 2의 타이타닉호 파이 차트를 살펴보십시오. 승객의 "거의 절반"이 1등석 또는 2등석 승객임을 보여주려고 할 때 파이 차트가 유용합니다. 더 자세한 정보를 표시하는 것이 목표일 때는 막대 차트가 시각적인 해석에 더 편리합니다. 그림 3의 그래프는 막대 차트에 표시된 것과 동일한 데이터를 보여줍니다.  

그림 3: 막대 차트에 표시한 그림 2의 데이터

그림 3에서 1등석 승객보다 2등석 승객이 적다는 것을 쉽게 알 수 있습니다. 왜냐하면 우리 눈에는 막대 차트에서 길이를 비교하는 것이 파이 차트에서 면적을 비교하는 것보다 쉽기 때문입니다.

그림 3: 여러 수준의 변수에 막대 차트 사용

수준이 여러 개인 변수의 전체 대비 부문별 구성비를 확인하려고 할 때 파이 차트가 가장 적합한 그래프가 아닐 경우가 종종 있습니다. 그림 4의 파이 차트는 다양한 영화 장르에 대한 전체 대비 장르별 구성비를 보여주지만 이렇게 시각화한 데이터는 해석하기 어렵습니다.

그림 4: 다양한 범주에 대한 파이 차트

조각이 너무 많은 파이에서는 전체 대비 부문별 관계의 세부 사항을 처리하기 어렵습니다. 또한 그림 2에서와 같이, 유사한 크기의 범주 간 차이도 구별하기 어렵습니다. 예를 들어, 공포 영화와 애니메이션 영화 중 어떤 장르 영화가 더 많을까요? 파이 차트로는 판단하기 어렵습니다. 

그림 5는 같은 데이터에 대한 막대 차트입니다. 

그림 5: 막대 차트에 표시한 그림 4의 데이터

다양한 영화 장르에 대한 전체 대비 부문별 구성비는 파이 차트보다 막대 차트에서 더 쉽게 확인됩니다. 또한 애니메이션 영화보다 공포 영화가 더 많다는 것도 알 수 있습니다. 막대에 라벨을 추가하거나 알파벳 순서가 아닌 백분율 순서로 막대를 정렬하는 방식으로 막대 차트를 개선할 수 있습니다. 그림 6의 정렬된 막대 차트에서는 전체 대비 장르별 구성비와 애니메이션 영화보다 공포 영화가 많다는 사실이 쉽게 확인됩니다.

그림 6: 백분율로 정렬한 막대 차트

그림 4: 여러 파이 차트를 사용하여 전체 대비 부문별 구성비 변동 표시

전체 대비 부문별 구성비 변동을 보여주는 것이 목표일 때, 특히 상세한 특정 사항에 초점을 맞추려는 것이 아닐 때, 파이 차트를 여러 개 사용하는 것이 유용합니다. 그림 7은 2006년에 최초로 스마트폰이 출시되었을 때를 시작으로 스마트폰의 변천사 데이터를 보여줍니다. 각 파이는 특정 연도의 운영 체제별 시장 점유율을 전체 대비 부문별 구성비로 보여줍니다.

그림 7: 전체 대비 범주별 구성비 변동을 보여주는 파이 차트

2006년에 Windows 운영 체제의 시장 점유율이 50%로 시작하여 2011년에 크게 감소된 양상을 확인할 수 있습니다. 마찬가지로, 안드로이드 운영체제는 2008년까지 시장에 등장하지 않았으며 2011년에 이르러 시장 점유율이 50%를 넘어섰다는 것을 알 수 있습니다.여기서 목표는 시간이 지남에 따른 전체 대비 부문별 구성비 변동을 보여주는 것입니다. 시간 경과에 따른 운영 체제별 변동을 보여주는 것이 목표라면 선 그래프가 더 적합합니다.

파이 차트와 데이터 유형

범주형 또는 명목형 데이터: 파이 차트에 적합

파이 차트는 범주형 또는 명목형 데이터에 대한 전체 대비 부문 구성비를 표시하는 데 적합합니다. 파이의 조각들은 일반적으로 총량 대비 백분율을 나타냅니다.

범주형 데이터의 경우, 대개 표본이 여러 그룹으로 나뉘며 반응 순서가 정의됩니다. 예를 들어, "매우 비동의"부터 "매우 동의"까지 척도로 의견을 묻는 설문조사에서 응답자의 반응은 범주형입니다.

명목형 데이터에서도 표본을 여러 그룹으로 나누지만 특정 순서는 없습니다. 명목형 변수의 한 가지 예로 거주 국가를 들 수 있습니다. 국가 약칭을 사용하거나 숫자를 사용하여 국가 이름을 코드로 지정할 수 있습니다. 어느 방식으로든 여러 데이터 그룹의 이름만 지정하면 됩니다. 

연속형 데이터: 다른 차트 유형 선택

일반적으로 연속형 데이터에는 파이 차트가 적합하지 않습니다. 연속형 데이터는 가능한 값이 수없이 많은 척도로 측정되므로 전체 대비 범주별 구성비를 보여주는 것이 의미가 없습니다. 다음은 연속형 데이터의 몇 가지 예입니다. 

  • 연령
  • 혈압
  • 가중치
  • 온도
  • 속도