混合云架构
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

2.4 存储

2.4.1 概述

存储是数据的载体,称它是企业IT基础设施的根基也不为过。就如同“百花齐放”的数据库技术一样,出于自身业务场景适用性和成本等因素的考虑,企业在进行IT架构设计时也需要对存储进行技术选型。

在传统的数据中心或自建的机房中,实现大规模存储通常需要购买独立的存储设备,即俗称的“磁盘阵列”。对于任何一家主流的存储设备厂商,登录其网站首页,都会看到数种乃至数十种存储产品同时在售卖。此时企业需要先根据业务场景决定选择哪种存储类型,常见的存储类型有:

● SAN(Storage Area Network,存储区域网络),一种在服务器和外部存储资源或独立的存储资源之间实现高速、可靠访问的专用高速网络。

● NAS(Network Attached Storage,网络附属存储),一种采用直接与网络介质相连的特殊设备实现的文件数据存储。

● OSD(Object-based Storage Device,对象存储设备),又称KV(Key-Value,键值)存储,一种基于对象存储设备构建的存储系统,存储单元是“对象(Object)”。

限于篇幅,这里不对它们的技术细节进行展开介绍了,感兴趣的读者可以自行在网上搜索。这三种存储类型之间的性能对比如图2-46所示。

图2-46 三种存储类型之间的性能对比

由此,我们大概可以知道它们各自“擅长”和“不擅长”的领域。

● SAN:高性能、高单位容量成本,常见于高IOPS(Input/Output Operations Per Second)的随机读/写场景,如大型券商交易系统。

● NAS:易共享性、较高的连续读/写IOPS,常见于企业内文件共享场景,如分布式视频渲染。

● OSD:大容量、低单位容量成本、无结构化数据存储,常见的场景是海量图片存储,如大型网站的静态数据存储。

然而,即使根据业务场景选择了最合适的存储类型,也还需要在存储介质中进行选择,以平衡性能、容量和成本。如图2-47所示,目前主流的存储介质有HDD、SATA SSD和NVMe SSD三种,其中NVMe SSD正在迅速取代SATA SSD,其单位容量成本也逐渐向后者靠拢。总体来说,从上至下,三种存储介质的单位容量成本和性能均递增。

图2-47 数据中心常见的存储介质

这样一来,单是以上列出的存储类型+存储介质的组合,就有9种,还不算各种存储类型内的细分和同时使用多种存储介质的混合存储。目前阿里云官网上提供超过15种存储产品,各产品内部又有多种性能规格可供选择。如果每一种产品背后都需要一个硬件架构单独设计的阵列,这对于一个云厂商来说将是不可想象的。

那么,是否能有一种设计,在满足存储最本质的功能——作为数据的载体后,通过软件在这个载体的上层实现存储协议,从而大规模、高性能、低成本地提供各种存储产品供用户选择呢?阿里云所有存储产品的共同底座——盘古(pangu)便是这样一种产品。

另外,云计算又面对各种场景的存储需求,如ECS对块存储和快照有需求、面向互联网有对象存储需求等。所以,阿里云形成了以盘古为底座的多层次存储架构,如图2-48所示。

图2-48 阿里云存储架构

从图2-48可以看出,Block Server为ECS提供块存储服务,同时通过Snapshot Server为ECS提供快照服务;OSS Server通过RESTful API对外提供对象存储服务,盘古组件则为其提供一个分布式存储底座(后面将详细介绍盘古组件)。