![巴拉巴西网络科学](https://wfqqreader-1252317822.image.myqcloud.com/cover/719/28252719/b_28252719.jpg)
1.11 小结
本节简要介绍了图论的一些基本概念和网络科学使用的一些工具。图1-17总结了网络的一些基本性质,为我们进一步研究网络提供了形式化语言。
![](https://epubservercos.yuewen.com/9E455E/16154823505021006/epubprivate/OEBPS/Images/Figure-P97_11371.jpg?sign=1738883700-mggE9OniVtVuBzV38blm99PVx0PoLz8z-0-69de1fdf1ea6cc070c154695cc6ab27a)
图1-17 图表学
在网络科学领域,我们经常按照网络的一些基本性质对其进行区分。这里,我们将概述最常见的一些网络类型,还列出了具有某个特定性质的真实系统。注意,很多真实网络可以同时具备这些基本性质中的多个。例如,万维网是带自环的无向多重图;手机通话网络是有向加权无自环的网络。
网络科学研究的许多网络包含数千个甚至数百万个节点和链接(表1-1)。因此,除了图1-17所示的那些小网络,我们还需要走得更远。如果想初步了解我们将会碰到的网络,可以看一下图1-4a所示的酵母蛋白质相互作用网络。该网络过于复杂,目测的方式对于理解和认识这类网络不再适用。因此,我们需要使用网络科学的工具来刻画网络的拓扑。
首先,我们使用本节介绍的基本方法来测量蛋白质相互作用网络的特性。如图1-4a所示,该网络是一个无向网络,有N=2018个蛋白质作为节点,L=2930个交互关系作为链接。因此,根据公式1.2,该网络的平均度为=2.90,表明一个蛋白质和两到三个其他蛋白质存在相互作用。不过,这个数字是有误导性的。实际上,如图1-4b、c中的度分布pk所示,大多数节点只有很少几个链接。精确地讲,该网络中69%的节点有少于3个链接,即k<
。大量只有少数几个链接的节点和少数几个有很多链接的枢纽节点并存——最大的枢纽节点有多达92个链接。节点的度差异之大,源于第3章介绍的网络无标度特性。我们将看到,度分布的形状决定着网络的很多性质,例如网络健壮性和病毒的传播。
其次,广度优先搜索算法(边栏1.5)可以帮助我们确定该网络直径为dmax=14。我们可能会认为节点间距离d的差异也会很大,因为有些节点距离很近,其他节点则相距很远。然而,如图1-18a所示,距离的分布却不是这样的:距离的分布pd在5和6之间有一个峰值,意味着大部分节点间的距离比较小,在平均距离=5.61附近。另外,随着d的增加,pd快速减小,这意味着大的距离很少出现。实际上,距离分布的方差是σd=1.64,这说明大部分路径的长度在平均值
的附近。这就是第2章讨论的小世界性质的体现。
广度优先搜索算法还告诉我们,蛋白质相互作用网络不是连通的,而是由185个连通分支组成,参见图1-4a中孤立的簇和节点。被称为巨连通分支的最大连通分支包含了全部2018个节点中的1647个;其他所有连通分支都很小。我们在随后的章节中会看到,这是真实网络中的常见情形。
蛋白质相互作用网络的平均集聚系数是=0.12。我们在随后的章节中会看到,这意味着高度的局部聚集性。另一个启示来自集聚系数和节点度之间的关系,即图1-18b所示的函数C(k)。C(k)随着节点度k的增加而减小,这表明小度节点的局部集聚系数明显高于枢纽节点的局部集聚系数。因此,小度节点的邻居之间连接相对稠密,而枢纽节点的邻居之间连接相对稀疏。这是第8章讨论的网络层级结构的必然结果。
最后,还有一个有趣的现象:枢纽节点倾向于和小度节点相连,使得该网络呈现出星型的轮辐结构(图1-4a)。这源于第6章探讨的度相关性。度相关性影响着很多基于网络的过程,包括信息扩散过程、控制网络所需的驱动节点个数等。
综上所述,如图1-4和图1-18所展示的那样,本章介绍的一些量可以帮助我们认识真实网络的一些关键性质。随后的章节将系统地研究这些网络性质,带你理解这些网络性质在认识复杂系统方面发挥的重要作用。
![](https://epubservercos.yuewen.com/9E455E/16154823505021006/epubprivate/OEBPS/Images/Figure-P98_11612.jpg?sign=1738883700-sUVDNIJEKLGG1pXFKmuOxQARejIVxiP9-0-6c529c31a474ad39c2710d79718c91f5)
图1-18 刻画真实网络
酵母蛋白质相互作用网络经常被生物学家和网络科学家研究。该网络的拓扑如图1-4a所示,网络中包含N=2018个节点和L=2930个链接,其中一个连通分支占据了全部节点的81%,除此之外,还有一些小的连通分支和许多孤立的节点。
(a)蛋白质相互作用网络的距离分布pd反映了随机选择的两个节点之间距离为d(最短路径的长度)的概率。图中灰色的垂直线对应着平均路径长度=5.61。
(b)平均局部集聚系数和节点度的关系。函数C(k)是度为k的节点的平均局部集聚系数。