大数据分析:R基础及应用
上QQ阅读APP看书,第一时间看更新

第2章 大数据相关技术

大数据处理流程主要是指从海量数据中获取需要的信息并进行加工分析得到有用知识的输出过程。大数据处理流程的关键技术包括大数据存储和管理及大数据检索使用(包括数据挖掘和智能分析)。围绕大数据,一批新兴的数据存储、数据挖掘、数据处理与分析技术不断涌现,使得对海量数据的处理变得更加简便快速。大数据处理流程一般包括以下几个步骤:数据采集/清洗、数据存储、数据挖掘及数据呈现,如图2.1所示。

图2.1 大数据处理流程