上QQ阅读APP看书,第一时间看更新
第3章 等同于大数据的Hadoop
在本章中,我们为读者们介绍:
❖ Hadoop的核心理念是什么?
❖ Hadoop的核心基础框架上包含哪些组件?
❖ Hadoop的生态系统中还有哪些有用的组件?
❖ Spark有什么用?
❖ Spark和Hadoop系统有什么关联?
Hadoop可以处理结构化数据,同时也可以很好地处理非结构化或者半结构化数据。在今天,Hadoop已经成为存储、处理和分析大数据的标准平台。当人们说要搭建大数据平台时,很多时候默认的就是搭建Hadoop平台。
本章介绍的是Hadoop核心系统上的各个组件,以及系统上相关的其他各种组件。由于本书的重点在于Hadoop技术的实际应用,而不是讲解Hadoop技术,所以因篇幅关系,我们并不会在本章中描述所有的Hadoop组件。
在本章的最后,我们会为读者介绍Spark系统。