大数据存储技术
上QQ阅读APP看书,第一时间看更新

第2章 分布式文件系统

布式文件系统是对单机文件系统的扩展。文件存储作为数据存储的最基本形式,在一个计算机系统中占有重要的地位。本书讨论的是大数据的存储,而分布式文件系统是组成分布式大数据系统的一个非常重要的部件。分布式文件系统将单机文件系统进行扩展,甚至可以扩展到数千台机器或者全球统一分布式文件系统。本章首先对文件系统进行分析,然后将单机的文件系统扩展到一个由数千台机器构造的分布式文件系统架构,最后对与分布式文件系统相关的课题进行讨论,包括文件系统的可靠性、扩展性和一致性。

作为数据存储的基础,文件系统的重要作用毋庸置疑,而对于大数据存储来说,分布式文件系统也是其基础。本章不讨论如何应用分布式文件系统,而是对分布式文件系统的实现基础展开讨论,即如何利用所需的接口以及底层的物理计算资源实现一个分布式文件系统。