大数据可视化
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

1.1.2 可视化的历史

人类历来就有使用图形来描绘量化信息的习惯,可视化与制图、统计图形的发展历史相互交织在一起,还与20世纪科技的发展密切相关。根据可视化历史中的里程碑事件和不同历史时期的数据呈现方式,可视化的发展历程一般概括为以下几个主要阶段[9]

17世纪前:早期地图与图表

在17世纪以前,数据的表达形式相对比较简单,人们会制作一些几何图表和地图,以记录和展示一些重要信息,这些图表通常被视为可视化的起源。

1600—1699年:物理测量

进入17世纪,物理测量得到了很好的发展,与时间、空间、距离有关的测量方式不断完善,测量得到的数据主要应用于制作地图、天文分析,一些基于真实测量数据的可视化方法逐渐被科学家们探索出来。例如,1686年绘制的天气图(如图1-6所示),显示了地球的主流风场,这也是向量场可视化的鼻祖。

图1-6 1686年绘制的天气图[5]

1700—1799年:新的图形形式

进入18世纪,数据逐步向精准化和量化的阶段发展,数据的价值开始被人们所重视,人们开始有意识地搜集整理数据,尝试对地质、经济和医学数据进行专题绘图,以及探索用抽象图形的方式来进行数据表达,发明了一些崭新的数据可视化形式。Joseph Priestley在1765年绘制了第一个时间线图,采用单根线表示人的生命周期,在整体上比较公元前1200年—公元1750年2000个著名人物的生平。后来,William Playfair发明了条形图、折线图(如图1-7所示)、饼状图等现在常用的统计图表。

1800—1899年:数据图形的发展

19世纪上半叶,统计图形和专题制图的数量出现了爆炸式的增长。在统计图形方面,很多统计图形的常用形式都已出现,包括直方图、时间线、轮廓线等。在专题制图方面,制图从单一地图发展为综合地图集,可描绘各种主题(经济、社会、医学、物理等)的数据,并引入了多种新颖的表示形式。19世纪下半叶,人们不断探索新的数据表现形式,进入了数据图形的黄金时期,这一时期出现了不少可视化的经典案例,包括前面提到的拿破仑进军莫斯科历史事件的流图可视化和伦敦“鬼图”,还有南丁格尔玫瑰图(如图1-8所示)。著名的护理专家Florence Nightingale(南丁格尔)绘制了玫瑰图(该图一个切角表示一个月,红色代表死于战争、蓝色代表死于疾病、黑色代表死于其他原因),该图分析和呈现了克里米亚战争期间士兵死亡人数的变化和死亡的原因,从而发现疾病才是导致伤亡的主要原因。

图1-7 丹麦和挪威1700~1780年的贸易进出口序列图[6]

图1-8 南丁格尔玫瑰图[7]

1900—1949年:现代休眠期

20世纪上半叶,可视化并没有明显创新。不过政府、商业机构和科研部门开始广泛使用可视化统计图形,可视化在航空、物理和天文等领域也有应用。例如,1933年,Henry Beck设计的伦敦地铁图(如图1-9所示)成为地铁路线的标准可视化方法,一直沿用至今。

图1-9 Henry Beck设计的伦敦地铁图[8]

1950—1975年:复苏期

现代电子计算机的诞生彻底地改变了数据分析工作,让人类处理数据的能力有了跨越式的提升,人们逐渐开始使用计算机程序取代手绘图形。1967年,法国人Jacques Bertin发表了里程碑式的著作——Semiology of Graphics(《图形符号学》)[10],提出利用形状、大小、颜色、位置等视觉变量来设计和呈现数据(如图1-10所示),为信息可视化奠定了理论基础。

1976—1982年:多维信息的可视化

随着计算机技术的不断发展,人们不断探索利用计算机编程实现交互式可视化,数据处理范围也变得更广,期间发明了一些具有里程碑意义的信息可视化方法,包括增强散点图表达方法、散点图矩阵、星形图、鱼眼方法、马赛克图、平行坐标等。图1-11展示了利用平行坐标分析汽车不同维度的数据。

图1-10 Bertin提出的视觉变量[11]

图1-11 使用汽车数据绘制的平行坐标[9]

1983—2004年:科学可视化和信息可视化形成

这一时期,随着数据类型和数据量的增加,数据可视化开始蓬勃发展。1982年,美国国家科学基金会首次召开会议并命名科学可视化(scientific visualization);1990年,IEEE举办了首届可视化会议(IEEE Visualization Conference);2012年,会议更名为IEEE Conference on Scientific Visualization。

在此期间,针对抽象的、非结构化数据的可视化研究也不断增多,出现了大量关于文本数据、高维数据的可视表达。1989年,Card、Mackinlay和Robertson等人采用“信息可视化”(information visualization)命名这个学科。1995年,IEEE举办了信息可视化会议(IEEE Information Visualization),2007年会议更名为IEEE Conference on Information Visualization。

2005年至今:可视分析学

进入21世纪,随着数据量和复杂度的不断增加,人们需要研究新的可视化方法,利用可视交互界面,通过交互利用人的智慧辅助用户从复杂数据中挖掘有用信息,从而出现了这门新兴的学科,即可视分析学。2006年,IEEE召开了IEEE Symposium on Visual Analytics Science and Technology,2012年会议更名为IEEE Conference on Visual Analytics Science and Technology。