파레토 차트

파레토 차트

파레토 차트는 명목형 변수의 수준별 빈도 수를 순서대로 정렬하여 보여줍니다.

파레토 차트의 사용 방법

파레토 차트는 우선적으로 해결해야 문제를 결정하는 데 유용합니다. 파레토 차트를 통해 범주형 변수에 대해 발생 빈도가 가장 높은 결과를 찾아낼 수 있습합니다.

데이터의 빈도 수를 정렬하여 보여주는 파레토 차트

파레토 차트는 막대 차트의 특별한 예입니다. 파레토 차트에서는 최고에서 최저 빈도 수 순서로 막대가 정렬됩니다. 대개 공정 개선에서 가장 먼저 집중해야 할 영역을 찾아내는 데 파레토 차트가 사용됩니다. 

파레토 차트는 범주형 또는 명목형 변수의 여러 가지 수준에 대한 값의 빈도 수를 보여줍니다. 파레토 차트는 "80/20" 규칙을 기반으로 합니다. 이 규칙은 문제의 80% 정도가 20%의 원인에서 비롯되는 결과라는 의미입니다. 또한 이 규칙을 "결정적 소수와 사소한 다수"라고도 합니다. 다시 말해서 문제의 많은 사소한 많은 원인들은 무시하고 몇 가지 근본 원인에만 집중하면 된다는 것을 의미합니다. 그림 1은 파레토 차트의 예입니다.

그림 6: 변수에 대한 정렬된 빈도 수를 보여주는 파레토 차트

회사 공정의 감사 결과로 확인된 몇 가지 유형의 사실을 보여주는 파레토 차트입니다. 가장 일반적인 사실은 표준 운영 절차(SOP)를 따르지 않았다는 것입니다.

파레토 차트와 막대 차트의 차이점

위에서 언급했듯이, 파레토 차트는  막대 차트의 특별한 예입니다. 파레토 차트에서는 최고에서 최저 높이 순서로 막대가 정렬됩니다. 막대 차트에서는 높음에서 낮음 순서를 반드시 적용하지는 않습니다. 막대 차트에서는 종종 사전순 정렬 또는 기타 논리적 순서를 사용합니다.

그림 2는 그림 1의 파레토 차트와 동일한 감사 데이터에 대한 막대 차트를 보여줍니다.

그림 2: 두 차트 사이 차이점을 강조하면서 그림 1과 동일한 데이터를 보여주는 막대 차트

막대 차트로도 가장 빈도 높은 문제를 찾아낼 수는 있지만 이러한 용도에 파레토 차트만큼 효과적이지 않습니다. 

파레토 차트 예

대부분 소프트웨어를 사용하여 파레토 차트를 생성합니다. 몇 가지 도구를 사용하여 사용자 정의 기능을 추가할 수도 있습니다.

위 그림 1의 감사 결과에 대한 파레토 차트는 기본적인 결과를 보여줍니다. 의사결정을 돕기 위해 아래 그림 3과 같이 차트에 메모도 추가할 수 있습니다.

그림 3: 데이터에서 발견된 결과를 표시하는 라벨이 있는 파레토 차트

누적 빈도 선 추가

누적 빈도에 대한 선도 파레토 차트에 추가할 수 있습니다. 그림 4는 감사 결과에 추가된 누적 빈도 선을 보여줍니다.

그림 4: 누적 빈도 선이 포함된 파레토 차트

누적 백분율 곡선과 누적 백분율 축은 오른쪽에 있습니다. 처음 두 가지 감사 결과가 전체 결과의 75% 정도를 차지합니다. (80/20 규칙은 근사치임에 유의하십시오) 여기서 회사는 처음 두 가지 결과에 집중할 가능성이 높습니다. 예에서는 여러 가지 색상을 사용하여 두 가지 최빈도 결과를 강조해서 보여줍니다.

몇 가지 반응과 범주 결합

일부 데이터에는 "결정적 소수" 범주 외에 "사소한 다수" 범주가 상당히 많이 있습니다. 그림 5는 헬프데스크에 대한 불만사항 조사 결과를 보여줍니다.

그림 5: 헬프데스크 서비스 불만 관련 데이터를 보여주는 파레토 차트

파레토 차트는 몇 가지 반응만으로 여러 가지 유형의 불만사항을 보여줌을 알 수 있습니다. JMP를 사용하면 6부터 9 사이 막대들에 대한 원인들을 결합할 수 있습니다. 그림 6의 파레토 차트는 이러한 원인을 "기타" 범주로 통합한 결과를 보여줍니다. 

그림 6: 6-9 사이 변수가 결합된 파레토 차트

여러 원인을 기타 범주로 묶은 마지막 막대는 다른 색상을 사용합니다. 범주를 결합할 때 결합된 범주를 마지막 막대로 놓는 것이 가장 좋습니다. JMP에서는 이 작업이 자동으로 실행됩니다. 이러한 방식으로 마지막 막대는 결합된 범주들로 구성되었다는 사실을 강조하여 개별 원인별 막대들과 결합된 막대의 혼동을 방지합니다. 헬프데스크 데이터의 경우, 처음 세 가지 유형의 불만사항이 발생한 근본 원인을 파악하는 데 집중해야 합니다.

묶음 막대 차트

변수가 많은 범주로 구성되어 있을 경우, 효율적으로 시각화하기에는 파레토 차트의 범위가 너무 넓습니다. 한 가지 해결책으로 그림 6과 같이 여러 범주를 기타 범주로 묶는 방법이 있습니다. 대안은 묶음 막대 차트를 사용하는 것입니다.

파레토 차트와 데이터 유형

파레토 차트는 명목형 변수 값들의 개수를 사용하는 데이터에 적합합니다. 연속형 변수에 대한 값을 갖는 데이터에는 파레토 차트가 적합하지 않습니다.

범주형 데이터의 경우, 표본이 대개 여러 그룹으로 나뉘며 반응 순서가 정의될 수 있습니다. 예를 들어, "매우 비동의"부터 "매우 동의"까지 척도로 의견을 묻는 설문조사에서 응답자의 반응은 범주형입니다. 이 경우에는 파레토 차트가 유용하지 않은데, 그 이유는 파레토 차트에서는 변수에 정의된 순서가 아닌 빈도 수로 데이터가 정렬되기 때문입니다.