2.10 小结:真实网络不是随机的
自1959年被提出以来,随机网络模型就成了研究复杂网络的主流数学方法。该模型认为,复杂系统中观察到的看上去随机的网络应该被描述成纯粹随机的网络。如此一来,随机网络模型将复杂性等同于随机性。因此,我们不禁要问:
我们真的相信真实网络是随机的吗?
答案显然是否定的。例如,蛋白质间的相互作用受严格的生物化学定律支配,因此,细胞要发挥其功用则其化学结构不可能是随机的。同样,在随机社会中,对一个美国学生而言,他的某个同学和中国工厂的某个工人成为他朋友的概率几乎相当。这似乎不合乎逻辑。
现实中,我们猜测大部分复杂系统的背后有一个深层次的秩序存在。这一秩序必然会反映在描述复杂系统架构的网络结构中,从而导致其网络结构和纯粹的随机网络之间存在系统性偏差。
随机网络在多大程度上可以刻画真实系统,不能由认识论来决定,而应该通过系统的定量比较来决定。如前文所述,随机网络理论做出了许多定量预测,这使得我们可以定量地判定随机网络在多大程度上可以刻画真实系统:
度分布
随机网络的度分布是一个二项分布,在kN的极限情况下可以通过泊松分布进行很好的近似。然而,如图2-5所示,泊松分布不能刻画真实网络的度分布。真实系统中,大度节点的数量要比随机网络模型预测的多得多。
连通性
随机网络理论预测,在>1时,网络中会出现巨连通分支。本章探讨过的所有网络都满足这一条件。不过,这些网络大多不满足>lnN的条件(表2-1)。这意味着,除了巨连通分支,这些网络还包含一些孤立的小连通分支。实际上,除去少数几个网络,大部分真实网络中并不包含孤立的小连通分支。
平均路径长度
随机网络理论预测,平均路径长度服从公式2.19。这是对实际观测路径长度的一个合理近似。因此,随机网络模型可以解释小世界现象的出现。
集聚系数
随机网络中,局部集聚系数和节点的度无关,以1/N依赖于网络大小N。相比之下,真实网络中实际测量出的C(k)随着节点度的增大而减小,且与网络大小基本无关(图2-13)。
总之,小世界现象是唯一可以由随机网络模型合理解释的性质。在真实网络中,从度分布到集聚系数等所有其他网络特性,都与随机网络有着显著差异。瓦茨和斯托加茨对埃尔德什-雷尼模型的扩展,成功地解释了高集聚系数C和低平均路径长度的共存,却不能解释度分布和C(k)。事实上,我们接触的真实网络越多,就越容易得出如下结论:没有任何一个真实网络可以由随机网络模型准确刻画。
边栏2.11
随机网络一览
定义:N个节点,每对节点之间的连接概率是p。
平均度:
=p(N-1)
平均链接数:
度分布:
二项形式:
泊松形式:
巨连通分支(NG):
<1:NG~lnN
>lnN:NG~(p-pc)N
平均距离:
集聚系数:
这一结论自然而然地引出了一个疑问:既然真实网络不是随机的,为什么我们还要用一个章节来介绍随机网络模型呢?答案很简单:在继续探讨真实网络的性质时,随机网络模型将会为我们提供一个重要参照。每当观测到某种网络性质时,我们都会问,该性质是否只是偶然出现的。为此,我们可以使用随机网络模型作为指南:如果该性质在随机网络中存在,则意味着它可以由随机性解释。如果该性质在随机网络中不存在,则它很可能标志着某种秩序——需要更深入的解释。因此,尽管随机网络模型对大多数真实系统而言可能是错误的,它对于网络科学仍然十分重要(边栏2.10)。
边栏2.10
随机网络和网络科学
随机网络和真实网络之间的不吻合提出了一个重要的问题:既然随机网络理论和真实网络如此不吻合,那么该理论为什么能够存活这么久呢?答案很简单:随机网络理论从来没有打算作为真实系统的模型。
埃尔德什和雷尼在他们的第一篇论文[2]中写道,随机网络“不仅从纯数学角度来看是有趣的。实际上,图的演化也可以视为某个国家或单位的通信网(例如铁路网、公路网或电网等)演化的简化模型”。然而,在他们关于随机网络的8篇系列论文[2-9]中,这是唯一一次提到随机网络理论潜在应用价值的地方。随机网络理论随后的发展则完全是由该问题的内在数学挑战驱动,而不是由其应用价值驱动的。
按照托马斯·库恩(Thomas Kuhn)的范式理论,人们很容易将网络科学视为从随机图论到真实网络理论的范式变化[30]。实际上,20世纪90年代末以前,网络范式还不存在。在那个时期,人们还没有系统地将图论模型和真实网络的性质进行对比。埃尔德什和雷尼的工作直到网络科学出现之后才取得数学领域之外的影响(图2-15)。
图2-15 网络科学和随机网络
今天我们将埃尔德什-雷尼模型视为网络理论的基础,而在此之前该模型的影响仅局限于数学的一个小分支。这一点可以从埃尔德什和雷尼在1959年和1960年发表前两篇关于随机网络的论文[2],[3]的年引用数量中清楚地看出来。在发表后的40年间,这两篇论文每年获得的引用数不超过10。不过,在无标度网络的第一批论文[21],[31],[32]将埃尔德什和雷尼提出的随机网络理论作为网络科学的参照模型之后,这两篇论文的引用数有了爆炸式的增长。
网络科学不但没有降低埃尔德什和雷尼的贡献,反而获得了他们起初不曾想到的影响。我们讨论随机网络和真实网络之间的差异,主要出于教学原因:为我们随后理解真实网络的性质提供一个合适的基础。