上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人
1.6.2 你将学到什么
本书将带领读者完成一个完整的数据仓库搭建及需求实现项目,可以大致将其划分为3个部分:项目需求及框架讲解前期准备部分、项目框架搭建数据仓库核心部分和项目需求实现数据治理部分。
在项目需求及框架讲解部分,对数据仓库的架构知识进行了重点讲解,并着重分析了数据仓库应该满足的重要功能和需求,通过学习本部分内容,读者可以全面地了解一个数据仓库项目的具体需求,以及如何根据需求完成框架的选型。读者可以跟随本部分内容一步步搭建自己的虚拟机系统。完成本部分内容的学习,读者需要掌握必要的Linux系统操作常识。通过学习本部分内容,相信读者能增进对Linux系统的理解。
在项目框架搭建数据仓库核心部分,重点讲解了数据仓库的建模理论,并完成了数据从采集到分层搭建的全过程。在本部分内容中,读者将会了解一条数据在数据仓库中是如何流动、清洗、转换的,并将掌握DataX、Flume、Kafka等数据采集工具的工作原理及应用方法。在本部分内容中,也将通过代码完成数据仓库项目的所有指标需求。
在数据治理部分,实现了数据仓库的很多治理功能,包括即席查询、集群监控、安全认证、权限管理、数据质量管理等,对众多的大数据框架进行了讲解。读者可以通过本部分内容查阅实现数据治理的不同功能的经典框架。
通过对数据仓库系统的学习,读者能够对数据仓库项目建立清晰、明确的概念,系统、全面地掌握各个数据仓库项目技术,轻松应对各种数据仓库的难题。