更新时间:2019-01-04 20:18:55
封面
版权信息
前言
第1章 Spark架构与集群环境
1.1 Spark概述与架构
1.2 在Linux集群上部署Spark
1.3 Spark集群试运行
1.4 Intellij IDEA的安装与配置
1.5 Eclipse IDE的安装与配置
1.6 使用Spark Shell开发运行Spark程序
1.7 本章小结
第2章 Spark编程模型
2.1 RDD弹性分布式数据集
2.2 Spark程序模型
2.3 Spark算子
2.4 本章小结
第3章 Spark机制原理
3.1 Spark应用执行机制分析
3.2 Spark调度机制
3.3 Spark存储与I/O
3.4 Spark通信机制
3.5 容错机制及依赖
3.6 Shuffle机制
3.7 本章小结
第4章 深入Spark内核
4.1 Spark代码布局
4.2 Spark执行主线[RDD→Task]剖析
4.3 Client、Master和Worker交互过程剖析
4.4 Shuffle触发
4.5 Spark存储策略
4.6 本章小结
第5章 Spark on YARN
5.1 YARN概述
5.2 Spark on YARN的部署模式
5.3 Spark on YARN的配置重点
5.4 本章小结
第6章 BDAS生态主要模块
6.1 Spark SQL
6.2 Spark Streaming
6.3 SparkR
6.4 MLlib on Spark
6.5 本章小结
第7章 Spark调优
7.1 参数配置
7.2 调优技巧
7.3 实践中常见调优问题及思考
7.4 本章小结
第8章 Spark 2.0.0
8.1 功能变化
8.2 Core以及Spark SQL的改变
8.3 MLlib
8.4 SparkR
8.5 Streaming
8.6 依赖、打包
8.7 本章小结