饼图
尽管常常受到批评,饼图仍然是一种非常常见的图表类型。在本文中,你将学习如何最好地使用这种经常被误用的图表类型。
什么是饼图?
饼图展示了一个总量如何在分类变量的不同级别之间分配,表现为一个被分成径向切片的圆形。每个分类值对应圆形的一个切片,每个切片的大小(包括面积和弧长)表示每个类别级别占整个的比例。
上面的饼图展示了一个虚构小镇选举的投票分布情况。我们可以看到,雷耶斯(由第一个蓝色扇形代表)获得了不到一半的选票。朱(黄色)位居第二,约占三分之一选票,而威廉姆斯(紫色)垫底,约占五分之一选票。右上角的注释提供了更精确的比例判断,但饼图整体上展示了选票分布的情况。
何时使用饼图
饼图的使用场景相对较窄,其定义很好地概括了这一点。要使用饼图,你必须有一个整体数量被分成若干个不同部分。在饼图中,你的主要目标应该是比较每个部分对整体的贡献,而不是比较各部分之间。如果上述条件不满足,饼图就不合适,应使用其他类型的图表。
构成整体的价值和分割整体类别通常有两种主要类型。首先,当“整体”代表总数时。这类例子包括按候选人划分的选举投票数,或按用户类型(例如访客、新用户、现有用户)划分的交易数量。
第二种“整体”类型是当总数是实际数据变量的总和时。例如,我们可能不关心交易数量,而是所有交易的货币总额。将这个总数按用户类型、年龄段或地理位置等属性划分,可能会提供关于业务最成功领域的洞察。
数据结构示例
地区 | 总收入 |
---|---|
北部 | 491 064.51 |
东 | 283 445.43 |
南 | 128 753.87 |
西 | 263 391.13 |
饼图的数据可以像上表那样进行汇总,其中第一列表示类别,第二列表示该类别的比例、频率或数量。通常情况下,总和不需单独指定,除非需要在生成的图形的其他位置列出。或者,有些工具可以直接处理未汇总的数据,如下表所示,实际上在创建饼图时将数据汇总到上表中。
使用饼图的最佳实践
添加注释
实际上,从饼图中很难辨别确切的百分比,除了像1/2(50%)、1/3(33%)和1/4(25%)这样的小分数。此外,如果饼图切片的值旨在表示数量而不是比例,饼图通常缺乏刻度标记,无法直接根据切片大小估算值。正因如此,注释是饼图的常规组成部分。
考虑切片的顺序
一个良好的切片顺序能让读者更容易理解图表所表达的信息。通常的排序方式是从最大的切片到最小的切片,这在类别值非常接近时特别有用。然而,如果类别级别具有固有的顺序,那么按照这种顺序绘制切片通常更好。
至于选择起点,从有向性的方向绘制切片是个好主意。可视化工具通常会从右侧或顶部开始。虽然从右侧开始有关于角度测量的惯例的数学基础,但从顶部开始感觉更直观,因为它与我们从上到下阅读的方式一致,也与我们思考时钟或手表表盘上时间进程的方式一致。
我们这里不按大小排序,因为标签是有意义的。
限制饼图切片数量
包含大量扇形的饼图可能难以阅读。最小的扇形可能难以看清,而且选择足够的颜色以使所有扇形都区分开来也可能很困难。建议各不相同,但如果你有超过大约五个类别,你可能需要考虑使用不同的图表类型。作为另一个选项,你可以考虑将小扇形合并到一个“其他”扇形中,用中性的灰色着色。
避免扭曲效果
准确读取饼图需要确保每个扇形的面积、弧长和角度都能准确反映数据。虽然避免三维效果对任何图表都有好处,但对饼图来说尤其重要。压扁或拉伸圆形,或添加不必要的深度,都很容易扭曲每个扇形与整体大小的比较。
另一种扭曲可能来自“爆炸型”饼图,其中切片从中心拉出以示强调。这种强调是有代价的,因为缝隙可能使实际判断部分与整体的比例变得更加困难。
常见误用
将饼图适配不兼容的数据
使用饼图时最常见的错误之一是将其应用于不表示部分与整体比较的数据。这种混淆通常发生在要绘制的值为百分比或比例,但它们并不构成一个完整的整体时。下面的示例展示了被调查者使用每个应用程序的频率,但由于许多人使用了多个应用程序,这些比例的总和远超过100%。
另一个棘手的情况是,用于每个组的值是一个不是总和的汇总统计数据。下方的图表是基于多种交易类型的平均交易金额构建的。然而,因为它忽略了每种交易类型的使用频率,所以它扭曲了每种类型带来的收入量。虽然支票的平均值最高,但它们在现实中可能也很少使用。在这两种情况下,条形图都是合适的图表类型。
使用饼图比较不同组别
如果你想要比较不同组之间的差异,而不是比较每个组与整体之间的差异,那么你最好选择其他类型的图表。即使按大小排序扇区,也很难判断两个扇区之间的差异,特别是当它们远离起点/终点时。在下面的示例中,你可能因为顺序而认为第二个扇区比第三个扇区大,但实际上对应的条形图显示相反的情况。从饼图中你能真正得出的主要结论是,这两个扇区在整体中的比例大致相同。
在多个饼图中比较值
可能存在需要将多个饼图相互比较的情况:例如,比较多年间的用户人口分布。然而,这会遇到与上一节类似的问题,即需要比较不同组别。更糟糕的是,这是在比较多个饼图,因此你无法像往常一样轻松依赖饼图切片的顺序进行对比。当需要这种组别间的比较时,使用不同的图表类型,如堆叠条形图、分组柱状图或折线图来展示数据通常是一个更好的选择。就像实际派一样,饼图也最好单独查看。
比较饼图可能意味着老年群体比例的缩小,但分组柱状图显示了年轻群体的增长。
常见的饼图选项
绝对频率与相对频率
饼图可以通过绝对值或比例进行标注。通常情况下,用绝对值标注扇区大小,用扇区大小暗示比例是常规做法,但需要仔细考虑可视化目标,以决定最适合图表的标注风格。在某些情况下,在标注中同时包含数值可能是值得的。
环形图
环形图(又名甜甜圈图)本质上是在饼图中心挖去一个圆形。总的来说,饼图和环形图在可读性上没有显著差异,因此选择环形图而非标准圆形主要出于美观考虑。环形形状的一个小优点是中心区域可用于附加信息或报告统计数据。
相关图
条形图
饼图最大的竞争者来自条形图 。大多数情况下,你不会想要使用饼图——条形图能更紧凑、更清晰地传达要点。饼图的大部分问题通过使用条形图可以得到解决。然而,条形图并不能立即展示部分与整体之间的比较,这是饼图的主要优势。
堆叠条形图
另一方面,堆叠条形图类型在传达部分与整体比较的能力上,可以证明是与饼图强有力的竞争者。单个堆叠条形图可以被视为饼图的切片展开成矩形形式。矩形形式也使得跨不同组别比较分类分解更加容易。然而,饼图在 熟悉度和美观性 方面仍有优势,因此在部分与整体比较的使用场景中,仍然值得考虑。
瓦片图
另一种替代饼图的方式是瓦菲尔图,也称为方形图或方块饼图。瓦菲尔图由 100 个图标组成,通常是排列在 10 x 10 网格中的方形。每个图标代表数据的 1%,图标根据数据的类别分布进行着色。虽然需要将类别数量进行一些四舍五入以适应图表结构——在这个图表中永远不要拆分图标——但它可以是一种使每个类别的相对比例更容易阅读的方式。
可视化工具
大多数可视化工具都能够创建饼图,尽管它们的使用场景有限。环形图相对不太常见,但确实没有太多情况下它们比饼图更有必要。尽管饼图在大多数可视化需求中已不再流行,但重要的是要认识到它们是一种常见的图表,人们通常知道如何阅读。饼图在它们理想的工作中依然表现出色:立即展示部分与整体比较的目标。
饼图是用于数据可视化的多种图表类型之一。您可以通过阅读我们关于图表类型、如何选择合适的数据可视化的文章,或浏览数据图表精通指南来了解更多信息。