数据可视化的过程,其实就是根据数值,用标尺、颜色、位置等各种视觉暗示的组合来表现数据的过程。
所以要想做好数据可视化,您就首先需要对这些用于表现数据的组件充分了解。
基于数据可视化,组件可以分为四种:视觉暗示、坐标系、标尺以及背景信息。
无论在谱图的什么位置,可视化都是基于数据和这四种组件创建的。
视觉暗示
可视化最基本的形式就是简单地把数据映射成彩色图形。它的工作原理就是大脑倾向于寻找模式,你可以在图形和它所代表的数字间来回切换。
视觉暗示包括位置、长度、角度、方向、形状、面积和体积、颜色(饱和度和色相)。
坐标系
编码数据的时候,总得把物体放到一定的位置。有一个结构化的空间,还有指定图形和颜色画在哪里的规则,这就是坐标系,它赋予XY坐标或经纬度以意义。
坐标系包括直角坐标系、极坐标系、地理坐标系三种主要类型。
标尺
坐标系指定了可视化的维度,而标尺则制定了在每一个维度里数据映射到哪里。标尺主要有三种,数字标尺、分类标尺和时间标尺。
背景信息
背景信息(帮助更好地理解数据相关的5W信息,即何人、何事、何时、何地、为何)可以使数据更清晰,并且能正确引导读者。至少,几个月后回过头来再看的时候,它可以提醒你这张图在说什么。
本质上,可视化是一个抽象的过程,是把数据映射到了几何图形和颜色上。从技术角度看,这很容易做到。你可以很轻松地用纸笔画出各种形状并涂上颜色。难点在于,你要知道什么形状和颜色是最合适的、画在哪里以及画多大。
对于可视化来说,视觉暗示、坐标系、标尺和背景信息都是你拥有的原材料。视觉暗示是人们看到的主要部分,坐标系和标尺可以使其结构化,创造出空间感,背景信息则赋予了数据以生命,使其更贴切,更容易被理解,从而更有价值。
知道每一部分是如何发挥作用的,尽情发挥,并观察别人看图的时候得到了什么信息。不要忘了最重要的东西,没有数据,一切都是空谈。同样如果数据很空洞,得到的可视化图表也会是空洞的。即使数据提供了多维度的信息,而且粒度足够小,使你能观察到细节,那你也必须知道应该观察些什么。
本文节选自《数据之美》
作者邱南森(美)