数据可视化分析:分析原理和Tableau、SQL实践(第2版)
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

2.4.1 数字、文字的可视化及可视化要素

1.数字、文字的可视化

人类学家推测,早在远古时代,人类祖先就会用石子、动物骨骼或者手指来记录简单的数字,到了“新石器时代”[4],人类开始“结绳记数”,甚至结绳记事。图2-6展示了古埃及壁画和印加的结绳记事(见本章参考资料[7])。从文明的角度看,人类已经尝试创造新的符号反映和表达已有事实,这是一个全新时代的开始,只是还局限在线性的简单表达上,抽象化程度很低。

图2-6 古埃及壁画(用打结的绳子丈量土地和估算收获)、印加的结绳记事

在人类逐步定居之后,农耕和商业的发展逐步催生了知识阶层,文字和语言的日渐成熟推动了知识积累,并在“轴心时代”(见本章参考资料[7])达到了传统文明的顶峰[5]

古希腊哲学家、数学家毕达哥拉斯提出“万物皆数”,“数是万物的本质”,并从5个手指中抽象出5个数字。后来罗马数字就用手指的数量代表最基本的数字,这和古巴比伦、中国甲骨文中的数字基本一致。汉字中如今还在普遍使用“一、二、三”及“十、廿、卅”等数字符号,都是“小数”符号的典型代表。

文字的发展史也是如此。早期象形文字用简单的线条和图形反映现实,埃及的象形文字、苏美尔文、古印度文及中国的甲骨文都是典型代表。如今还在用的汉字“人”“口”“手”,也只是在甲骨文的基础上做了简要的调整,如图2-7所示。

图2-7 数字和文字:早期的基本文字

可见,数字和文字符号的原始起源是对现实的记录和反映

2.可视化要素

如今,可视化案例无处不在。比如,用“图形”来代表男/女洗手间、用红黄绿代表交通规则信号或者疫情等级标识、用图形作为企业标识(如华为公司的“花瓣”)等,如图2-8所示。

图2-8 身边常见的可视化图形

现代心理学把位置、颜色、形状等能快速引起心理反应的信号统称为“前意识属性”(Pre-attentive Attributes),它们在人类的潜意识中活动,在极短时间内就能被识别,因此是可视化分析的最佳向导。主要的“前意识属性”如图2-9所示。

图2-9 常见的“前意识属性”

在大数据时代,数据“噪音”越来越多,快速、有效地表达信息就成了数据分析的关键。位置、颜色、形状、大小、长度等可视化要素,被用作数据分类、归纳总结、识别异常等分析目的。以交叉表为例,交叉表数据密度高,但不易于表达观点,通过增加颜色高亮背景,或转化为趋势,有助于把数据和观点合二为一,帮助阅读者快速获得有效信息,如图2-10所示。

图2-10 从交叉表到可视化展现

可见,可视化分析是业务用户进入大数据分析的捷径,可视化展现与数据展现结合,就有了报表、可视化图形、可视化交互仪表板、数据故事等多种样式。同时,分析师要牢记,分析的目的是辅助业务,可视化只是媒介,背后的数据总结、抽象部分才是关键。