如何选择合适的数据可视化

数据可视化是数据分析的重要组成部分,它们能够高效地将大量数据以图形格式进行总结。有多种图表可供选择 ,每种都有其独特的优势和适用场景。在分析过程中,选择合适的方式使用这些可视化来表示数据是最具挑战性的部分之一。

在本文中,我们将根据您想要执行的任务类型来探讨选择数据可视化的方法。

数据可视化的常见用途包括:

你正在分析的变量类型和可视化受众也会影响在每个角色中哪种图表效果最佳。某些可视化图表也可以根据这些因素用于多种目的。

用于展示随时间变化的数据的图表

将变量的值随时间变化进行可视化是最常见的应用之一。这些图表通常将时间放在水平轴上,从左向右移动,而将感兴趣变量的值放在垂直轴上。编码这些值的方法有多种:

bar-chart-and-line-chart

用于显示部分与整体组成的图表

有时,我们不仅需要知道总数,还需要知道构成该总数的组成部分。虽然其他图表(如标准条形图)可以用来比较各组成部分的值,但以下图表将部分与整体分解放在了首位:

Pie charts and stacked area charts are among the chart types that can be used to show part-to-whole comparisons.

用于查看数据分布的图表

可视化的一项重要用途是展示数据点值的分布情况。这在探索过程中特别有用,有助于构建对数据特征属性的理解。

Histograms and box plots are among the chart types that can be used to show distributions in data values.

用于比较组间数值的图表

数据可视化的另一个非常常见的应用是对比不同组之间的数值。这通常与其他数据可视化的作用相结合,例如展示随时间的变化,或观察数据的分布情况。

dot-plots-grouped-bar-chats

用于观察变量之间关系的图表

数据探索中的另一项任务是理解数据特征之间的关系。下面的图表类型可以用来绘制两个或多个变量之间的关系,以观察它们之间的趋势和模式。

Scatter plots and heatmaps are among the chart types that can be used to show distributions in data values.

用于查看地理数据的图表

有时,数据中包含地理数据,如经纬度或地区,如国家或州。虽然绘制这些数据可能只是在地图背景上扩展现有的可视化(例如,在散点图上绘制点),但也有一些图表类型会考虑制图领域。以下重点介绍其中两种:

The choropleth and cartogram are examples of charts used to depict geographical data.
正确:来自 census.gov 的美国人口地图

结语

为工作选择合适的图表取决于你正在查看的变量类型以及你希望从中获得什么。以上只是一个一般性指南:跳出标准模式可能会帮助你获得额外的见解。尝试不同的图表类型,以及每个图表中变量的编码方式。同时也要记住,你不必仅限于在一个图中展示所有内容。通常,保持每个单独的图尽可能简单明了,而使用多个图进行比较、展示趋势和演示多个变量之间的关系会更好。