1.2.1 SequoiaDB的产品概述
“湖仓一体”作为企业未来数据平台的重要基础架构,需要一种强有力的分布式数据库支撑其海量、多模、多态的数据类型。以此为目标,巨杉数据库公司在2011年产品投入研发之初,就专注于多模能力的“数据湖”产品,并于2013年正式发布了该产品的首个商用版本。2015年后,巨杉数据库更逐步加入数据分析引擎及跨引擎事务一致性能力,为客户提供具备海量联机数据交易及分析能力的“湖仓一体”数据基础设施。
2021年,面向客户对“湖仓一体”各个不同场景的需求,巨杉数据库公司细分出4大产品线。各个产品线均基于统一的SequoiaDB分布式数据库内核,可以按需独立部署,也可叠加使用,如图1-3所示。
● SequoiaDB-DP数据融合平台:面向数据中台的创新数据底座,数据实现一次写入、多引擎实时可读,并提供增强的数据分析引擎。各业务团队间可以充分实现数据融合,实现数据的交易分析一体化、流批一体化、多模数据一体化,让更多业务的海量数据处理能力从“T+1”提升到“T+0”。
● SequoiaDB-TP事务型数据库:面向海量数据联机交易及微服务的创新数据底座,兼容三大SQL关系型数据库语法,提供RR(Repeatable Read)数据隔离级别及跨引擎数据一致性能力。开发者可以放心地将事务一致性逻辑,交由数据库层进行处理,并自由地选择需要的SQL引擎,让开发人员回归到纯粹的业务设计上,以提升企业研发的“人效”。
● SequoiaDB-CM内容管理数据库:面向非结构化数据治理的创新数据底座,为其存储的每一个对象赋予标签、描述和内容。企业可以基于这些信息进行统一有效的管理、分类、检索和查询,实现非结构化数据治理;同时实现内容管理平台从“资源消耗中心”向“数据价值中心”转型,提升企业数据处理的“能效”。
● SequoiaDB-DOC文档型数据库:提供高度兼容MongoDB的JSON操作,可以有效协助客户进行文档型数据库的国产化迁移,为信创(信息技术应用创新)上下游产业提供金融级的数据基础设施。
图1-3 巨杉数据库湖仓一体架构及产品线
在巨杉数据库的典型应用架构中,企业通常基于其产品“湖仓一体”的架构特性,构建数据基础设施平台,以整合以往分散管理的结构化、半结构化和非结构化数据。巨杉数据库充分兼容包括MySQL、MariaDB、PostgreSQL、SparkSQL、S3、PosixFS、SDB JSON在内的多种接口,其特有的跨引擎事务一致性能力,可以有效简化多团队开发流程中对不同引擎及结构的ACID管理,在业务开发、数据处理、运维管理等多方面提升企业的综合数据管理效率。
目前SequoiaDB的企业用户已超过1000家,图1-4所示为部分客户。
图1-4 SequoiaDB的部分客户列表