从0到1:数据分析师养成宝典
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

1.3 数据分析的三种类型

数据分析师需要检查海量数据,进行数据清理、转换及数据建模,通过一系列的操作达到挖掘数据特征的目的,得出相应的结论,从而帮助企业做出正确的决策。数据分析分为描述性分析、探索性分析和验证性分析三种类型。

1.3.1 描述性分析

描述性分析就像复述一本书的主要情节一样对数据进行描述分析。如基本的统计量、总体样本、各种分布等。通过描述性分析,数据分析师能更透彻地了解相关数据,做到胸有成竹。描述性分析在数据分析类型中是最基础和常用的,数据分析师需要熟练掌握描述性分析方法,保证下一步数据分析工作顺利进行。

通过对数据的统计处理可以简洁地用几个统计值来表示一组数据的集中性和离散型,以及发现数据中的异常值。

例如,对食品烟酒类居民消费价格指数,衣着类居民消费价格指数和生活用品类居民消费价格指数描述分析,可以得到居民消费价格指数描述分析结果,见表1-1。

表1-1 居民消费价格指数描述分析结果

由此可见,描述性分析只能提供数据整体情况,供数据分析师进行初步分析。但仅依靠描述性分析报告往往不足以做出决策,因此需要使用其他方法进一步分析才能得到完善的报告。

1.3.2 探索性分析

面对纷繁的数据,数据分析师对相关数据没有足够的分析经验,会觉得无从下手,如果这时数据分析师直接将数据放入各种模型进行分析,往往会发现效果不佳。那么此时可以利用探索性分析,首先设置少量假定条件,然后进行数据分析、得出结论。

探索性分析是一种系统的数据分析方法。探索性分析展示了所有数据的分布情况,异常数据一目了然,同时也可以展示两两变量间的关系,从而得到所有汇总统计量。例如,在研究两个变量间的相关性时,可以通过观察两组样本间的差异值,分析指标没有达标的原因,从而预测出接下来一段时间内企业将会出现怎样的变化趋势。

通过绘制散点图来探索汽车速度与刹车距离这两组变量间的关系,如图1-4所示。

图1-4 汽车速度与刹车距离的散点图

从图中可以看出,汽车速度增加,刹车距离也相应增加。因此可以得出汽车速度与刹车距离之间大致呈正比例关系的结论。

这种分析方法能够让数据分析师从两组不相关的数据中发现内在联系,从而帮助企业预测未来的发展趋势,因此在数据分析师的工作中探索性分析的应用非常频繁。但这种分析方法得出的结论也不是最终结论。这就像是在寻找“参考答案”,但“参考答案”往往不止一种。这种方法通过企业过去的决策和其他相关因素探究对项目进程的影响。

1.3.3 验证性分析

验证性分析主要利用对已经完成的项目、项目成功或失败的原因和企业项目可能发生的情况进行分析判断,帮助企业确定最终能被采纳的最佳方案。完成分析之后,下一步就要撰写数据分析报告,这是数据分析结果的呈现,包括分析过程的总结、输出结论和策略。验证性分析一般不会独立使用,与其他分析行为组合使用才是最佳。

某电商网站付款界面的支付方式顺序为微信、支付宝、云闪付和货到付款。该电商网站与支付宝达成合作,为了提高支付宝付款的占比,该电商网站对支付方式的顺序进行调整,调整后的顺序为支付宝、微信、云闪付和货到付款。为了验证这种方法是否能提高支付宝支付的占比,数据分析师抽取了同样一批用户调整前与调整后的付款方式,并列成了如图1-5所示的柱状图。

图1-5 支付宝支付占比变化图

从图中可以看出,经过顺序调整,用支付宝支付的占比增加了将近两个百分点。由此数据分析师可以得出结论:支付方式顺序的调整是有必要的。

在数据运用分析当中,不管是描述性分析、探索性分析还是验证性分析,都要求数据分析师对数据源有清晰明了的认识,掌握对应的技能,才能真正实现数据价值的挖掘,对下一步的数据应用产生积极的影响。