帕累托图

什么是 帕累托图?

帕累托图按顺序显示名义型变量各个水平的频数计数。

如何使用 Pareto 图?

帕累托图可以帮助人们确定要首先解决哪些问题,有助于识别某个分类型变量频数最高的结果。

Pareto 图按顺序显示数据的频率计数

帕累托图是一种特殊的条形图。对于帕累托图,长条是按频数计数从高到低的顺序显示的。在流程改进过程中,这些图表常常用于确定首先需要关注的领域。

帕累托图按顺序显示分类型或名义型变量不同水平的数值的频数计数。这些图表基于“80/20”法则。即:大约 80% 的问题是由 20% 的原因导致的。“80/20”法则也被称为“至关重要的少数和微不足道的多数”。也就是说,您可以关注导致问题发生的少数至关重要的根本原因,忽略微不足道的多数原因。图 1 是帕累托图的一个示例。

图 1:按顺序显示“结果类型”这个变量频率计数的帕累托图

此图表显示了业务流程审计结果的类型。显而易见的发现是,未遵循标准操作程序 (SOP)。

帕累托图与条形图有何不同?

如上文所述,帕累托图是条形图的一种特殊示例。对于帕累托图,条形是按从高到低的顺序显示的。对于条形图,并没有强制性地从高到低排序。条形图常常按字母顺序排序,或者按某种其他逻辑顺序排序。

图 2 显示了与图 1 中帕累托图相同的审计数据的条形图。

图 2:显示与图 1 相同数据的条形图,突出显示了两个图表之间的差异

虽然您仍然可以使用条形图来识别发生频率最高的问题,但就此目的而言,它没有帕累托图那么直观、有效。

帕累托图示例

大多数人都选择使用软件来创建帕累托图。有些工具还可以让您增加定制化的功能。

上面图 1 中用于显示审计结果的帕累托图显示了基本结果。为了帮助您做出决策,您可以在图表中添加注释,如下图图 3 中所示。

图 3:在数据分析结果中显示带有标签的帕累托图

添加累积频数线条

帕累托图还可以添加一条代表累积频数的线条。图 4 显示了一条添加到审计结果中的累积频数线条。

图 4:含有累积频数线条的帕累托图

累积百分比曲线和累积百分比数轴在右侧。前两个结果大约占所有结果的 75%。(请记住,80/20 法则是近似的。)这里,企业可能会关注前两个结果。这个示例还使用了颜色来突出显示前两个结果。

合并具有少量响应的类别

除了有“至关重要的少数”类别外,有些数据还有许多“微不足道的多数”类别。图 5 显示了对服务总台进行投诉的调查结果。

图 5:显示服务台服务投诉数据的帕累托图

我们可以看到,此帕累托图显示了只有少量响应的多种类型的投诉。可以使用 JMP 将第 6 至第 9 个条形的原因合并在一起。图 6 中的帕累托图显示了将这些原因合并成“其他”类别的结果。

图 6:合并了变量6-变量9的帕累托图

最后一个条形,使用了不同的颜色来显示将多个原因合并成“其他”类别。合并类别时,最佳做法是将合并后的类别作为最后一个条形。JMP 会自动执行此操作。这种方法突出显示了此条形是由合并的类别组成的,避免了将合并的条形与代表单某个原因的条形混在一起。对于服务台数据,显然,需要关注的是确定前 3 种投诉类型的根本原因。

堆叠填充条形图

当变量有许多类别时,帕累托图可能会变得太宽,不利于进行可视化显示。一个解决方案是将多个类别合并成“其他”类别,如图 6 所示。或者,也可以使用堆叠填充条形图

帕累托图和数据类型

帕累托图比较适合名义型变量的值计数数据。帕累托图对于有连续型变量的数据并不是很好的选择。

对于分类型数据,样本会分成多个组,并且响应可能有已定义的顺序。例如,在一项调查中,要求您从“强烈不同意”到“强烈同意”这样的评价区间来提供意见,您的响应就是分类型数据。帕累托图在这里不太可能有用,因为它是按频数计数(而不是按为变量定义的顺序)对数据排序的。