1.4 图数据库与其他NoSQL数据库的对比
为了克服关系数据库在大型企业级应用中的弊端,NoSQL数据库逐渐流行起来。NoSQL数据库专注于解决大规模数据集合、多重数据种类带来的挑战,尤其是大数据应用难题。同时NoSQL数据库的多样化也提供了多种不同的数据模型解决方案,每个解决方案都可以应用到不同的项目用例中。显然,Neo4j就是NoSQL中可以提供图数据模型的典型代表。
1.4.1 其他NoSQL数据库的弊端
目前大部分NoSQL类数据库的数据存储形式都是基于集合的,数据按照集合被划分开,比如文档数据库中的文档。NoSQL数据库的数据存储在不连贯的集合中,这使得数据之间的相互连接、建立关系变得困难。
要实现类似关系数据库的外键功能,通常人们会将某个数据集合直接嵌入到另一个数据集合中来实现两者之间的从属关系,但很明显这样创建数据集合之间的关系要付出很大的存储开销。
1.4.2 将键值对存储与图数据库相关联
如图1-9所示,键值(Key-Value)存储数据库,其数据按照键值对的形式进行组织、索引和存储,类似Java中的map,它适合不涉及过多数据关系的应用。因为能有效减少读写磁盘的次数,所以其性能非常高。
图1-9 键值对存储结构
如果将这些键值对相互关联,就可以得到一个图结构。通过这个图结构,可以表达数据之间的复杂关系,如图1-10所示。
图1-10 键值对存储结构与图结构相互关联
1.4.3 将文档存储与图数据库相关联
文档存储的层次化结构可容纳许多无模式的数据,可以轻松地将数据存储为树状结构。虽然树也是一种图形,但树只能表达从下到上的从属关系,如图1-11所示。
图1-11 文档存储结构
在树状存储结构中总会出现多次被嵌入的冗余数据,这增加了更新数据的困难,同时也难以确保数据的一致性。如果我们将冗余的数据去掉,然后用图结构将存在相互关系的数据相关联,数据冗余的问题就解决了,并且数据之间的关系变得更直观,如图1-12所示。
图1-12 文档存储结构与图结构相互关联