更新时间:2022-08-16 17:07:34
封面
版权信息
内容简介
前言
0 “疯狂”的大数据
0.1 大数据时代
0.2 数据就是“金库”
0.3 让大数据“活”起来
第1篇 Hadoop军营
1 Hadoop一石激起千层浪
1.1 Hadoop诞生——不仅仅是玩具
1.2 Hadoop发展——各路英雄集结
1.3 Hadoop和它的小伙伴们
1.4 Hadoop应用场景
1.5 小结
2 MapReduce奠定基石
2.1 MapReduce设计思想
2.2 MapReduce运行机制
2.3 MapReduce实例分析
2.4 小结
3 分布式文件系统
3.1 群雄并起的DFS
3.2 HDFS文件系统
3.3 小结
4 Hadoop体系的“四剑客”
4.1 数据仓库工具Hive
4.2 大数据仓库HBase
4.3 Pig编程语言
4.4 协管员ZooKeeper
4.5 小结
5 Hadoop资源管理与调度
5.1 Hadoop调度机制
5.2 Hadoop YARN资源调度
5.3 Apache Mesos资源调度
5.4 Mesos与YARN对比
5.5 小结
6 Hadoop集群管理之道
6.1 Hadoop集群管理与维护
6.2 Hadoop集群调优
6.3 Hadoop集群监控
6.4 小结
第2篇 Spark星火燎原
7 Spark宝刀出鞘
7.1 Spark的历史渊源
7.2 Spark和Hadoop MapReduce对比
7.3 Spark的适用场景
7.4 Spark的硬件配置
7.5 Spark架构
7.6 小结
8 Spark核心RDD
8.1 RDD简介
8.2 RDD的存储级别
8.3 RDD依赖与容错
8.4 RDD操作与接口
8.5 RDD编程示例
8.6 小结
9 Spark运行模式和流程
9.1 Spark运行模式
9.2 Spark作业流程
9.3 小结
10 Shark和Spark SQL
10.1 从Shark到Spark SQL
10.2 Spark SQL应用架构
10.3 Spark SQL之DataFrame
10.4 Spark SQL运行过程分析
10.5 小结
11 Spark Streaming流数据处理新贵
11.1 Spark Streaming是什么
11.2 Spark Streaming的架构
11.3 Spark Streaming的操作
11.4 Spark Streaming性能调优
11.5 小结
12 Spark GraphX图计算系统
12.1 图计算系统
12.2 Spark GraphX的框架
12.3 Spark GraphX的存储模式
12.4 Spark GraphX的图运算符
12.5 小结
13 Spark Cluster管理
13.1 Spark Cluster部署
13.2 Spark Cluster管理与监控
13.3 Spark高可用性
13.4 小结
第3篇 其他大数据处理技术
14 专为流数据而生的Storm
14.1 Storm起因
14.2 Storm的架构与组件
14.3 Storm的设计思想
14.4 Storm与Spark的区别
14.5 Storm的适用场景
14.6 Storm的应用
14.7 小结
15 Dremel和Drill
15.1 Dremel和Drill的历史背景
15.2 Dremel的原理与应用
15.3 Drill的架构与流程
15.4 Dremel和Drill的适用场景与应用
15.5 小结
第4篇 大数据下的日志分析系统
16 日志分析解决方案