上QQ阅读APP看书,第一时间看更新
1.1 关于数据分析,你需要知道的
1.1.1 什么是数据分析
当今的互联网世界,每时每刻都在产生海量的数据。毋庸置疑的是,几乎对任何组织来说,这些海量的数据中都蕴藏着巨大的价值。从数据中提取有价值的信息,其实就是数据分析的内生动力,也是这些年“数据分析”四个字高频度地出现在各种媒体、各种平台的主要原因。
关于“数据分析”,很多人经常用的百度百科上是这样定义的:数据分析是指用适当的统计分析方法对收集来的大量数据进行分析,提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。
维基百科上的定义则是这样的:Data analysis is a process of inspecting, cleansing, transforming, and modeling data with the goal of discovering useful information, informing conclusions, and supporting decision-making。(数据分析是对数据进行检查、清理、转换和建模的过程,其目标是从中发现、提取有价值的信息,进而得出结论,对决策提供支撑。)
百度百科根据方法和目的对数据分析进行了定义。而维基百科则根据数据分析的过程和目的对数据分析进行了定义。
其实,简单地概括,数据分析就是一个通过分析手段从数据中发现有价值的信息的过程。这个过程的起点是获取一份数据,这个过程的终点是发现对决策有支撑作用的信息。
一般来说,数据分析过程大致如下:
数据获取→数据清洗→数据处理→数据分析与建模→分析结果呈现→业务价值发现→业务价值实现。
用图来表示,则这个过程如图1.1所示。
图1.1