2010 年,我在秘鲁利马举办了一场交互式数据可视化研讨会,讨论数据集是否有一种独特的或至少是理想的可视化方式。对于一个简单的数据结构(例如,数百个数字的列表),大约有一半的 20 名参与者相信,有一种方式显然更适合传达数据,无论值的单位、范围、含义、上下文和可视化的可能目的如何。这场讨论实际上是另一个想法的结果,也引起了大多数参与者的共鸣:应该有一个指南来指示可视化每个可能数据集的最佳方式。所以我提出了以下练习:
让我们尝试找到所有可能的方法来可视化两个数字组成的极小数据集。然后,让我们尝试选择最佳的可视化方法。
有了这么小的数据集,您可能会认为我们会在不到 5 分钟的时间内完成这两项练习。然而,我们花了两个多小时却没有真正完成这两项任务。不仅可视化两个值的可能方法数量远高于预期,而且每种可视化方法都允许多种有趣的变化,并那么这份清单的意义何在?
我确信这个列表并不完整,可以以更好的方式组织。但我认为不可能建立一个明确的列表——它根本不存在。新的想法总是会出现(比如45)。在这个列表中提到的方法中,有些可以扩展到更大的数字列表,而其他方 墨西哥移动数据库 法则不能。这是因为它们没有单独描述每个值;相反,它们说明了值之间的关系(例如代表比例的值或坐标系)。通过向列表中添加更多数字,可能的组合数量会呈指数级增长。如果我们转向其他更丰富的数据集,会发生什么——比如说包含国家列表、数字列表和日期列表的表格?(无论如何,我说的是小数据集,没有什么可以称为“大数据”的。)数据集不仅包含更多值,还包含不同的单位。而且,不仅可以以不同的方式解释和语境化每个列表,列表与单个值之间的关系也可以以不同的方式解释和语境化。这是经典的复杂性背景:相互作用的简单元素;添加更多元素,可能的有趣(有意义)模式的数量就会急剧增加。
信息可视化是一种语言。
一种能够解释世界、讲述故事、指出具体的事实和对象、阐述模棱两可的信息、捍卫论点、攻击论点并传达思想和意识形态的语言。与任何语言一样,可视化也遵循组合和生成规则。和任何语言一样,不可能划定它的边界或列出它能够生成的所有对象。我以文本(从千禧年到最近的符号)开始和结束这份清单并非巧合:我认为可视化是写作的延伸。通过组合此列表中的某些方法,可以创建新的方法:共心环形图(14.)可用于可视化树结构,虚线(38.)可用于地图,具有实线形状的线图(6.c.)可以演变为蒸汽图,表面与值成比例的自由形状(23.)可在统计图或非矩形树状图中找到;使用粗体字体(45.)可以构建特殊的热图等。此列表的目的是激发这种组合、生成和创造性思维。在利马进行这项练习对每位参与者来说都是一次深思熟虑的经历,它提出了许多新的想法和辩论,这就是我想在这里带来的。不要将此列表视为问题的 45 个答案,而应将其视为新问题的 45 个出发点。引发了新的问题和讨论。以下是可视化两个数字的不同方法的列表。在许多情况下,可视化直接取决于值的单位、含义、解释和上下文。一些示例可能被视为同一主题的变体,其他示例则被视为过于古怪甚至深奥。另一方面,我相信你们中的许多人会想出列表中未包含的可视化方法(在这种情况下,请将它们包括在评论中!)。我只解释一些方法;一般来说,它们很清楚而且众所周知。有些方法名声很差,但我不会参与这种讨论。我也会避免讨论根据上下文和目标哪种方法更好。