Power BI数据可视化从入门到实战
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

1.2 为什么要做数据可视化

移动互联网时代,数据的采集每时每刻都在发生,购物、听音乐、浏览新闻资讯时都会产生用户行为数据。随着数据技术的发展,每家企业都积累了无数的数据资产,《经济学人》杂志曾发表封面文章称,数据已经取代了石油,成为21世纪最有价值的资源。但是,在数据成为有价值的资源之前,必然需要通过数据分析,将有价值的信息一目了然地进行展示,由此可见数据分析与可视化的重要性。

数据可视化领域中的一个非常典型的案例有力地证明了可视化的重要性。

有四组数据,每组数据包含xy共11对数字(见表1.1)。若肉眼观察这四组数据,则很难看出其中的规律。也许你会觉得这就是四组随机生成的数字,并不存在特定规律。

表1.1 四组数据

当使用散点图对数据进行作图时,你会惊奇地发现四组数据之间的规律竟如此明显,如图1.1所示。观察散点图,我们可以发现这四组数据并不是随机数,而是四组“刻意为之”的数据,数据之间存在非常明显的关系和趋势。

图1.1 四组数据的散点图

事实上,这四组数据是由英国统计学家佛兰克·安斯库姆(Frank Anscombe)精心组合而成的。这四组数据中的xy在统计特征上惊人的一致,每组数据中的xy对应的均值、方差、相关系数、线性回归线都是一样的,这进一步证明了数据可视化在数据分析中的重要性。这四组数据就是统计学上著名的安斯库姆四重奏(Anscombe's Quartet),又称为安斯库姆四重奏陷阱。

我们在生活和工作中会遇到各种各样的数据,可视化将杂乱无序的数据变成规律、能辅助决策的信息。信息辅助决策,不同信息之间产生联系,这种联系又可以形成为人类所用的知识。总体而言,数据可视化有以下优点:

(1)更符合人类的直觉思维,人类大脑接收的信息90%以上是通过视觉获取的。

(2)数据和图表相辅相成,图表在尊重数据的基础上帮助数据“传情达意”。

(3)数据是图表背后的“灵魂”,在数据的基础上设计的可视化,最终还需要依靠数据来支撑。

(4)可视化是数据的升华,往往能将洞见扩展到对比、趋势、关系及分布等总体特征。