Hadoop + Spark生态系统操作与实战指南
上QQ阅读APP看书,第一时间看更新

3.5 小结

前两章已经讲述了Hadoop的简介、生态系统、开发环境搭建、集群搭建。从本章开始到第7章讲解怎样在Apache版本下的Hadoop平台进行操作。

本章首先详细描述了MapReduce框架结构以及MapReduce执行步骤。接着详细描述了HDFS的运行原理和框架结构,深入介绍了HDFS中每个角色的作用,之后通过HDFS客户端和Eclipse+Java实现对HDFS的具体操作。最后,描述了YARN的原理、组成、应用和工作流程。