上QQ阅读APP看书,第一时间看更新
本书特点
本书基于Spark发行版2.4,循序渐进,主要分为基本理论、应用实践和总结。本书主要有下面3个特点。
● 突出实践。本书第一部分包含20余个Spark应用的例子,绝大部分带有真实数据集,供读者实践;本书第二部分是一个选自生产环境的完整的真实案例,并针对本书做了相应的优化与简化。
● 层次分明,循序渐进。本书针对学习曲线进行了优化,对于应用型内容,主要突出使用方法与实践案例;对于原理与关键问题,会深入讲解,甚至少部分还会涉及源码解读与相关论文解析。
● 技术版本新。Spark 2.0是Spark一个非常重要的版本,在设计理念与使用方式上都与以前版本有较大不同,本书完稿前的新版本2.4.4,包含了这一版本的新特性,并根据社区进展对Spark 3.0的相关特性进行了讨论与展望。