0.3 推动网络科学出现的两股力量
网络科学是一个新学科。对于该学科的精确起始时间,人们或许有不同的见解。不过,大家都一致认为,网络科学作为一个独立的学科是在21世纪出现的。
为什么网络科学没有在200年前出现呢?毕竟该学科所研究的多数网络都不是什么新事物:代谢网络可以追溯到生命起源,有大约40亿年的历史了;社会网络则和我们人类一样历史悠久。而且,包括生物化学、社会学、脑科学在内的很多学科,几十年来一直在研究自己的网络。作为一个数学成果丰硕的子领域,图论自从1735年就开始研究网络了。综上所述,我们有充分的理由把网络科学称为21世纪的科学吗?
在21世纪伊始,一些特别的事情发生了,这些事情突破了单个研究领域的范畴,催生了网络科学这一新学科的出现(图0-3)。要想理解为什么网络科学出现在今天而不是200年前,我们需要对推动网络科学出现的两股力量进行探讨。
图0-3 网络科学的出现
虽然关于网络的研究有着悠久的历史——起源于图论和社会学,网络科学的新篇章却是在21世纪的第一个10年间才出现的。
人们对网络的兴趣日渐浓厚,可以从对网络科学的两篇经典论文的引用模式中看出。第一篇是保罗·埃尔德什和阿尔弗雷德·雷尼于1959年发表的论文[2],该论文标志着图论领域开始研究随机网络;第二篇是马克·格兰诺维特(Mark Granovetter)于1973年发表的论文[3],该论文是社会网络领域中引用次数最多的论文。图中展示了这两篇论文自发表以来每年获得的引用数。两篇论文在它们各自的领域中都获得了高度认可,但在各自领域之外的影响却很有限。21世纪以来,网络科学的出现使得这两篇论文的引用数迅速增长,这得益于网络科学给它们带来了全新的跨学科的关注。
网络地图的出现
对于由数百到数十亿个彼此连接的组成部分构成的系统,要想详细描述其行为,我们需要一幅描绘该系统连接模式的地图。对于社会系统,我们需要一个列表,上面准确列出每个人的朋友、朋友的朋友等。对于万维网,我们需要一幅地图来标明网页之间的连接关系。对于细胞,我们需要的地图是一个列表,上面详细列出基因、蛋白质和代谢体之间的相互作用和化学反应。
在过去,我们缺少描绘网络的工具,要记录下刻画网络的大量数据也很困难。互联网技术革命为我们提供了快速而有效的数据共享方法和廉价的数字存储方式,从根本上提高了我们收集、整理、共享和分析真实网络数据的能力。
得益于技术进步,我们在千禧年来临的时候见证了网络地图的爆炸式出现(边栏0.2)。例如,CAIDA和DIMES项目绘制出第一个大规模的互联网地图;生物学家们投入数亿美元,通过实验绘制出人类细胞中的蛋白质相互作用网络;Facebook、Twitter、领英(LinkedIn)等社交网络公司在为准确获取人们之间的朋友关系和职场关系努力着;美国国家卫生研究院(NIH)的Connectome项目致力于系统地描绘出哺乳动物大脑的神经元连接关系。到了20世纪末,大量涌现的网络地图加快了网络科学的出现。
边栏0.2
网络地图起源
如今网络科学家们研究的少数几个网络地图是为了研究网络而生成的。大部分网络原本只是其他一些研究项目的副产品,在网络科学家的手中才变成了网络地图。
(1)细胞中的各个化学反应,是生物化学家们历经150多年逐个发现的。到了20世纪90年代,这些化学反应被收集到一个中心数据库时,才提供了将这些化学反应组织成细胞生化网络的契机。
(2)每部电影的演员列表最初是散布在报纸、书刊和百科全书中的。随着互联网的出现,为满足影迷的好奇心,这些数据被收集到了中央数据库,例如imdb.com。这些数据库使得网络科学家们可以从中构建出好莱坞的演员关系网络。
(3)数百万学术论文的作者信息最初也散布在数千种期刊的目录中。最近,科学地图(Web of Science)、谷歌学术和其他学术服务系统将这些信息组织成了数据库,使网络科学家们可以重构出准确的科学合作关系网络。
网络科学早期的历史,很大程度上依赖于研究人员的精心设计,从那些已经存在的数据库中抽取出网络。网络科学改变了这一切:如今,获得大量资助的联合研究致力于绘制网络地图,以准确刻画生物、通信和社会系统的内部连接关系图。
网络特性的普适性
我们很容易列出在自然或社会中所遇到的不同网络之间的差异性:代谢网络中的节点是微小的分子,节点间的链接是由化学和量子力学定律支配的化学反应;万维网中的节点是网页,链接是供计算机算法解析地址使用的统一资源定位符(URL);社会网络中的节点是人,链接则表示家庭、职场、朋友和熟识关系。
这些网络的产生过程差异也很大:代谢网络是经过数十亿年的演化而形成的;万维网是由数百万的个人和组织共同努力建成的;社会网络是由数千年来的社会规范塑造而成的。考虑到这些网络所对应的系统在大小、性质、范畴、历史和演化方面有着千差万别,我们对于它们之间存在巨大差异并不感到奇怪。
网络科学的一个关键发现是:这些在不同的科学、自然、技术领域中形成的网络,其架构是彼此相似的,这说明它们在同样的组织原理的支配下形成。因此,我们可以采用同样的数学工具来探索这些网络及其所描述的系统。
普适性是本书的指导原则之一。我们不仅追求对具体网络性质的探索,对于每个具体的网络性质,我们也会探讨其适用范围有多广。我们旨在理解这些性质的形成原因,揭示指导网络演化的规律及其对于网络行为的意义。
综上所述,尽管很多学科对于网络科学都有重要贡献,但这个新学科的出现在相当大的程度上要归功于日益丰富的数据——这些来自各个学科的数据为我们提供了准确的网络地图。进而,这些网络地图使得研究网络科学的科学家们能够从众多网络特性中找出具有普适性的性质。普适性为新诞生的网络科学奠定了基础。