条形图

什么是条形图?

条形图显示分类型或名义型变量各个水平的值计数。

如何使用条形图?

条形图可帮助您了解变量的各个水平,还可用于检查错误。

要考虑哪些问题?

条形图用于名义型或分类型数据。对于连续型数据,请改用直方图

条形图显示数据的频率计数

条形图显示分类型或名义型变量不同水平的值的频数计数。有时,条形图还显示其他统计量,例如百分比。图 1 是对调查问题所做响应的条形图示例。

图 1:显示调查数据频数计数的条形图

条形显示变量的水平;长条高度显示该水平的响应计数。

条形图与直方图之间有何不同?

直方图与条形图之间的两个重要差异是条形之间的间距和数据的类型。直方图的条形之间没有间距,条形图的条形之间有间距。但是,您可以使用许多软件工具来修改条形图,使其条形之间没有间距,这将引入直方图与条形图之间的第二个重要差异。

直方图用于连续型数据;条形图用于分类型或名义型数据。请参阅下面的“条形图和数据类型”部分了解更多详细信息。

条形图与帕累托图之间有什么差异?

帕累托图是条形图的一种特殊示例。对于帕累托图,条形是按从高到低的顺序显示的。在质量控制中,这些图表常常用于确定问题最多的地方。

与直方图的相似之处是,帕累托图的条形之间没有间距。与直方图的不同之处是,帕累托图汇总名义型或分类型变量的计数。

图 2 提供了一个帕累托图示例,它汇总了业务流程审计结果的类型。图中包含一个表示类别的图例,它允许使用较长的标签,使类别更容易阅读。

图 2:显示分类型数据并含有对应图例的帕累托图

对除计数之外的其他统计量绘制图表

虽然所有示例都显示了含有计数的条形图,但这些图形也可以显示其他统计量,例如百分比。大多数软件工具都提供了灵活的选项,用户可以选择要对哪些统计量绘制图表。

 

条形图示例

人们常常使用软件来创建条形图。用户通常可以使用软件来创建垂直或水平的条形图,以及向条形图添加定制的功能。

下面是条形图的一些示例。您可能需要咨询统计人员或参考大量书籍和网站来确定哪种类型的条形图更适合您的数据。

图 3-15 使用来自 10 包糖果的数据。每一包有 100 颗糖果,并且已收集了每一包中 5 种口味糖果的计数。目标是这些糖果包中每种口味的糖果计数几乎相等,这意味着我们期望每一包中每种口味的糖果大约有 20 颗。对于 10 包糖果,我们期望每种口味的糖果大约有 200 颗。

第一步是条形图,如图 3所示:

图 3:条形图显示了10包糖果中每种类型糖果计数的条形图

软件将条形按口味名称的字母顺序排序,这可能是向受众显示结果的最佳方式。

如果希望将条形按由多到少递减的顺序排序,结果如图 4所示:

图 4:与图 3 相同的条形图,现在按递减顺序显示计数

现在可以看到,葡萄口味和香橙口味的糖果总计数相同。图 3 中其实也是这样,但没有这么容易看出来。

条形通常是垂直显示的。对于较长的图形标签,水平条形图往往表达地更好。图5在水平条形图中显示了使用长标签的同样的口味数据。如果我们改用垂直条形图,标签可能会比较难阅读。

图 5:水平条形图

在这些示例中,我们对所有条形使用了相同的颜色。通常来说,使用多种颜色会让图形更难理解。

但是,假设糖果公司要求每一包糖果中每种口味的糖果至少有 18 颗。对于 10 包糖果,每种口味的糖果至少需要 180 颗。由于数据显示樱桃口味的只有 120 颗,因此我们需要突出显示这个问题。图 6 使用了有阴影的条形来实现这个目的。还可以使用不同的颜色来突出显示代表樱桃口味的条形。

图 6:来自图 5 的水平条形图,并包含有一个有阴影的条形

还可以尝试对条形添加标签。图 7 向每个条形的末尾添加了计数。这种方法显示,苹果口味红色糖果也可能有问题,虽然它满足了每包 18 颗的要求,但仅仅是刚刚满足要求而已。

图 7:来自图 6 的水平条形图,现在含有频数计数标签

极端数据值如何影响条形图

条形图显示数据中的分类计数。与直方图不同,条形图不受极端值的影响。对于在条形中有很少(或很多)值的类别,条形图只是另外显示一个条形。图 8 显示了一个不同的糖果数据集,其中葡萄口味被替换为芒果口味。芒果口味的数量显著低于期望。

图 8:显示(非常低)极端值的条形图

图 9 显示了另一个示例,其中葡萄口味被替换为菠萝口味。凤梨口味的计数显著高于期望。

图 9:显示(非常高)极端值的条形图

条形图可以帮助识别数据中的错误值。在图 10 中,有一个数据值的“芒果”一词的写法出现了错误,这是明显的数据错误,应该修正。使用条形图来检查数据是否有误是很有帮助的。

图 10:显示具有明显拼写错误的分类的条形图

如何向条形图中添加组?

如果数据有多个分组,在一个条形图中将所有数据一起绘制出来有助于显示这些分组中的模式。图 11 合并了来自 3 个糖果工厂的数据。

图 11:显示分组数据的条形图

可以从图中看到哪些工厂在糖果包中使用了哪种口味。还可以看到问题,例如 A 工厂在糖果包中芒果口味的糖果太少。在这个示例中,按字母顺序对条形进行排序非常有用。我们无法按计数排序,因为不同工厂的顺序将会不同。

在这个示例中,对不同工厂使用不同的颜色可能会很有帮助。图 12 以不同的颜色显示了每个工厂。

图 12:显示分组数据的条形图,以不同的颜色表示不同的组

还可以在水平轴上显示计数,这样更容易从视觉上直观地比较计数,如图 13 中所示。

图 13:显示含有频数计数标签的分组数据的水平条形图

虽然图 13 更容易比较不同口味的计数,但它比图 12 中更难确定不同的工厂使用了哪些口味。

有很多方法可以向条形图中添加分组,这里仅展示少数几种方法。就您的数据而言,您需要考虑想要向受众表达什么消息,以及如何为传达此信息构建最佳图形。

堆叠条形图

相比较分组,您可以更希望使用堆叠条形图。可以使用堆叠条形图来显示各个分组的响应,对糖果数据而言,这些响应就是工厂。每组有一个条形。然后,变量的频数计数堆叠在代表每个工厂的条形中。对于糖果数据,口味计数将堆叠在代表每个工厂的条形中。图 14 显示了来自 3 个工厂的糖果数据堆叠条形图,使用了不同的颜色来代表每一种口味。

图 14:显示分组数据的堆叠条形图

在图 14 中,我们很容易看到,芒果口味只有A工厂使用,菠萝口味只有B工厂使用,葡萄口味只有C工厂使用。通过比较条形堆叠部分的大小,我们还可以看到,A 工厂芒果口味的糖果非常少,B 工厂菠萝口味的糖果非常多。

添加图例对堆叠条形图来说非常重要。许多软件工具都可以在堆叠条形图中添加标签,如图 15 中所示。例如,标签可以帮助我们看到,B 工厂樱桃口味的糖果和香橙口味的糖果总数相同。

图 15:显示每种口味糖果频数计数标签的堆叠条形图

您可能会发现,在最终做出关于颜色的决策之前,以灰度方式打印堆叠条形图会很有帮助。此外,如图 15 所示,添加标签时,您需要确保标签在代表堆叠条形每个元素的背景色下是可以阅读的。

条形图和数据类型

图 16-20 展示了,对于不同的数据类型,应该在何时使用条形图或直方图。

图 16:显示分类型数据的条形图,此类数据适合使用这种类型的图表
图 17:显示分类型数据的直方图,此类数据不适合使用这种类型的图表
图 18:显示名义型数据的条形图,此类数据适合使用这种类型的图表
图 19:显示名义型数据的直方图,此类数据不适合使用这种类型的图表
图 20:显示连续型数据的直方图,此类数据适合使用这种类型的图表

分类型或名义型数据:适合使用条形图

条形图对分类型或名义型数据比较适用,因为它们是在具有特定可能值的尺度上进行衡量的。

对于分类型数据,样本常常分成多个组,并且响应已有定义好的顺序。例如,在一项调查中,要求您从“强烈不同意”到“强烈同意”这样的评价区间来提供意见,您的响应就是分类型数据。

对于名义型数据,样本也分成多个组,但没有任何特定的顺序。例如,居住的国家/地区就是名义型变量。您可以使用国家/地区缩写,也可以使用数字对国家/地区名称编码。无论采用哪一种方式,您都只是在为不同的数据组命名而已。

连续型数据:使用直方图

条形图对连续型数据不适用,因为它们是在具有许多可能值的尺度上进行衡量的。以下是连续型数据的一些示例:

  • 年龄
  • 血压
  • 体重
  • 温度
  • 速度

对于所有的这些示例,应该使用直方图而不是条形图。