1701064180
1701064181
对原始状态的环来说,这种计算很容易,特别是当你将网络描绘成社会时,此时节点代表人,边代表朋友关系。这个假想的世界(“环形世界”)有几分像我们自己,因为我们也有60亿人,但除此之外,它是一个完全陌生的世界。它的居民注定要生活在异常严格的条件下,大家肩并肩地站在一个巨大无比的圆环上。然后,我们让每个人与他左侧的500人交友,然后再与其右侧的500人交友,但不允许他们与其他人交友。这样的世界中不会有六度分离,而是高达300万度的分离。
1701064182
1701064183
要知道为什么,请想象你与圆环上距离你最远的人之间的路径长度,就是远端与你径直对面的那个人。为了通过最短路径联系到他,你要联系你的第500个朋友(距离目标最近)。从那个人开始,最快路径是再次跳过中间的人,直接跳到那个人的第500个朋友,以此类推,每隔500人在圆环上跳跃前进。整个旅程需要30亿除以500,即600万步,但这是最遥远的目标。对于最近的目标——站在你身旁的人,只需要一步。所以平均起来,你和他人的距离大约为300万步,即300万度的分离。
1701064184
1701064185
在谱线的另一端,当变形结束,网络已完全随机时,计算同样直截了当。现在很显然,每个人与其他人之间只相距4步。想知道其原因,我们需要了解指数级增长。在随机世界中,如果你认识1 000个人(平均),他们每个人都认识1 000个人,这意味着有100万(1 000×1 000)人与你相隔2步以内,10亿人相隔3步以内,1万亿人(这个数字已经远远超过地球上的总人口)相隔4步以内。
1701064186
1701064187
以同样的论据推算我们自己的世界是很诱人的,这可以解释我们为何都是六度分离,但在真实世界里,论据不再有效。它忽略了真实的朋友圈会重叠的事实——你朋友的朋友很可能也是你的朋友,他们被计算了两次。
1701064188
1701064189
对于一个假想的网络,网络的稀疏和稠密完全随机,然而,计算却是有效的,因为朋友圈的重叠在这个例子中微不足道。你从巨大的60亿个样本中随机选择1 000人,你的朋友也是如此,结果证明,此时重叠的概率只有六百万分之一,所以基本上没有重复计数。当然,这样的世界是很奇怪的。你很可能认识喜马拉雅山上的农夫、威尔士亲王或者你的邻居。你的朋友会分散在各个大陆、各个阶层、各个种族、各个宗教。在一个没有重叠的世界中,没有社会结构,没有家庭,没有社区。
1701064190
1701064191
这一论点突出了理解更普遍意义上的重叠的重要性。网络中重叠的平均数量通过第二个统计量进行量化,这个统计量就是“集群”(clustering),集群的定义是连接到同一节点的两个节点彼此互相连接的概率(就人而论,即朋友的朋友彼此也是朋友的概率)。在上文讨论的两种极端模型中,集群的变化范围相当大,初始圆环的集群高达0.75,随机网络的集群则低至六百万分之一。
1701064192
1701064193
为了计算出0.75这个数字的来源,你需要意识到,圆环中你和你身边的人的所有朋友几乎都是相同的(精确地说,是1 000个朋友中的998个都相同),你和与你最亲近的那个人的朋友重叠率几乎等于1。另一方面,和你最遥远的朋友,即距离你500步的那个朋友之间,你们仅仅共享大约一半的朋友(他们是圆环上碰巧被夹在你们中间的499人),所以你与最遥远的人的重叠率是499/1 000,约等于1/2。对于其他介于最近和最远之间的朋友,重叠率从1/2平滑地变成1,平均数为3/4,这就是集群为0.75的由来。下一步,我们可以应用类似的、但稍容易的推理来计算随机连接的情况,集群的推理结果应该等于六百万分之一。如果你充满好奇心,计算它会是一件很有乐趣的事情。但请你不要迷失在这些细节中。这里的关键点只是平均路径长度,随着我们将网络从谱线的一端变换到另一端,集群几乎变化了数百万倍。
1701064194
1701064195
虽然平均路径长度和集群这两个统计量的数值因一个相似因素而下降,但是它们体现了网络体系结构中非常不同的侧面。平均路径长度反映了全局结构;它取决于整个网络的连接方式,这无法从任何局部测量推断出来。集群反映了局部结构,它只取决于典型的邻居之间的相互连接,节点之间的关系纽带连接到了一个共同的中心。粗略地讲,平均路径长度决定了网络的大小,集群决定了裙带关系的强弱。
1701064196
1701064197
◎ ◎ ◎
1701064198
1701064199
到目前为止,我们已经分析了网络频谱的两个极端。但是我们仍然不清楚中间发生的事情。两个端点告诉我们,变换通过某种方式使圆环大大收缩,并破坏了它的集群。我们尚不知晓的是,这种变化是渐进的还是突发的。瓦茨和我都不知道如何用纯数学来解决这个问题,所以我们用电脑模拟巨大但可控范围内的网络变换,我们从有1 000个节点、每个节点有10条边的原始环开始。为了描绘出中间地带的结构变化,我们将平均路径长度和集群作为随机重连的边所占比例的函数,绘制出了它们的函数图像。
1701064200
1701064201
我们发现的结论十分惊人。即便是最微小的随机性也会使网络大幅收缩,导致平均路径长度开始暴跌。仅仅1%的重连(意味着每100条边中只有1条是随机的),平均路径长度就从原始水平下降了85%。进一步的重连只有极小的影响;曲线慢慢地下降到了一个平稳状态,表明网络已经收缩到了它所能达到的最小水平,仿佛它是完全随机的。与此同时,集群几乎没有任何变化。对于1%的重连,集群只下降了3%。连接从秩序井然的临近街坊中间被拉了出来,然而,集群几乎不受影响。只有在变换的晚期,平均路径长度塌缩很久以后,集群才开始显著下降。
1701064202
1701064203
我们可以很直观地解释这些结果。在变换开始时,最先重连的边充当了网络中相距遥远部分之间的捷径。它们之所以会打破平衡,是因为一种强大的非线性效应:它们不仅把两个节点连到了一起,而且把整个世界拉到了一起。例如,我喜欢在网络国际象棋俱乐部在线下棋,在那里,我同荷兰一家杂志社的编辑艾米洛成为朋友。由于这个捷径,我同他接近了很多,而且也同其他成千上万的荷兰人接近了很多,包括他所有的朋友,以及朋友的朋友。尽管我的朋友并未意识到,但实际上通过我和艾米洛创造的捷径,他们已经同艾米洛和艾米洛的朋友们更接近了。这座桥梁发挥了巨大的作用。
1701064204
1701064205
在我们的模拟中,最初的新捷径大大缩减了世界的规模,但对集群的影响要小得多。这意味着对于局部而言,变化成小世界是基本无法被检测到的。如果你经历了变换,你的直接邻居根本不会告诉你世界已经变小了。你的朋友数量仍然相同,这与他们是否将你连接到了更大的圈子完全无关。在这样的世界里,人们可能会认为不会受到类似艾滋病这样的疾病的威胁,他们的理由是:他们的性伴侣都不在高危人群中,然而在现实中,他们或许只与艾滋病病毒携带者相隔一两步。
1701064206
1701064207
这种模拟最重要的结果是,在重连过程中的广阔中间状态中,模型网络集群性很高,同时规模又很小。这种奇特的组合在数学上是新奇的。在传统网络中,规模大小和集群密切相关。随机网络规模很小,集群性很低;规则网络规模很大,集群性很高。重新连接的网络却设法让规模小和高度集群二者同时发生。
1701064208
1701064209
我们将拥有这对看似矛盾属性的网络称为“小世界网络”,人际关系之间也存在与之极为相似的矛盾,我们在紧密的圈子中运动,而全世界的人却都被非常短的关系连接到了一起。现在的问题是:大自然能否利用这种网络结构的特殊形式?如果能的话,目的又是什么?
1701064210
1701064211
◎ ◎ ◎
1701064212
1701064213
我们的模拟表明,小世界连接可能广泛存在于真实网络中,因为只需要有一小部分的捷径就足够了。为了验证这种假设,我们需要实证的例子,但这并不容易寻找。任何一个备选的例子都必须具备充分的特点,它的接线图的每一个细节我们都必须了解,每个节点和边都必须有翔实的记录,否则我们无法计算集群和平均路径长度。
1701064214
1701064215
此时,我想到了自己一年前在混沌课程中遇到的学生裴昆艺(Koeunyi Bae),裴昆艺曾做过一个关于美国西部电网的项目,项目里大约5 000座发电厂通过高压输电线连接在一起,输电线横跨落基山脉西部,进入加拿大西部的省份。裴昆艺和她的导师吉姆·索普为瓦茨提供了数据。数据包含了大量的详细信息,这些信息对工程师至关重要,例如输电线的耐压容量,节点按照变压器、变电站或发电机的分类等,但我们忽略了除了连接以外的一切信息。网格变成了一个个点通过边连接的抽象模式。为了检查电网是否是小世界网络,我们将它的集群和平均路径长度与具有相同数量的节点和边的随机网络进行比较。正如预测的那样,真实网络几乎与随机网络规模一样小,但是集群要高很多。具体而言,其平均路径长度仅是随机网络的1.5倍,而集群则是随机网络的16倍。
1701064216
1701064217
接下来,让我们从技术网络转向生物网络,我们来观察一种被称为秀丽线虫的小蠕虫的神经系统。对于这种卑微的生物,我们了解得比其他动物更多,甚至超过遗传学家的果蝇和肿瘤科医生的小鼠。秀丽线虫是一种透明的、土壤生的线虫,体长仅1毫米。我们已经绘制出这种蠕虫的全部959个细胞从受精到死亡每个阶段的图样。早在1998年,对秀丽线虫的全基因组测序就已经完成。这种生物看起来深奥,但对它的研究已经阐明了几个基本的细胞过程,从细胞死亡,到细胞信号传导,再到神经轴突导向,所有这些都是由蠕虫生物学家率先发现的,后来证明对人类有意义。这正是为什么人们十分关注秀丽线虫的原因:它或许是与人类共享诸多必不可少的生命过程的最简单的生物。
1701064218
1701064219
对我们而言,秀丽线虫的吸引力是它的神经系统已经被完全描绘出来,这是在任何其他生物上都尚未实现的壮举。事实上,秀丽线虫的302个神经元的接线图都存储在了电脑上。和电网一样,我们将神经元视为完全相同的(尽管生物学家区分出了118种不同类别的神经元),如果两个神经元被突触(化学连接)或缝隙连接(电子连接)联系起来,我们就认为这两个神经元是相连的。
1701064220
1701064221
结果证明,由此产生的抽象网络又是一个小世界。它的平均路径长度仅比对应的随机网络长18%,而它的集群却是随机网络的6倍。这意味着什么我们还不清楚,或许是较短的平均路径长度有利于生物全身的快速通信,尽管高度集群可能反映了反馈回路的存在和神经系统中的模块化结构。
1701064222
1701064223
电网和神经系统是两个完全不同的网络:一个由人类创造,另一个是进化而来。一个是有史以来建造的最庞大的机器之一,由成千上万公里的电缆连接的同步发电机组成的庞大网络;另一个是显微镜下的精致物品,数百万年的自然选择的产物,蜷伏在蠕虫身体中的网络。虽然二者差异巨大,但是它们的结构却惊人的相似。二者都达到了可能的最小规模。二者都是高度结构化的,绝不是随机的。诚然,我们的近似假设模糊了对这些研究结果的解释力——两种网络的小世界结构可能与它们的功能无关,因此毫无意义。但时间会说明一切,至少从现在来看,这种巧合是诱人的。
1701064224
1701064225
◎ ◎ ◎
1701064226
1701064227
社交网络似乎也是小世界,尽管我们没有意识到任何超越趣闻轶事的证据。特别是,我们想知道,六度分离的概念是否基于可验证的真实数据。或许它只是坊间传言而已。约翰·古尔自己无从知道,他认为它可能是来自无线电报的发明人古列尔莫·马可尼(Guglielmo Marconi),退回到那段岁月里,马可尼用电报站连接了整个地球。如果没有真实的数据,我们无法确定我们的理论是否像我们所预测的那样广泛适用。它也像适用于电网和神经系统一样适用于人类的社交网络吗?
1701064228
1701064229
与洛克菲勒大学的数学生物学家乔尔·科恩(Joel Cohen)的一次谈话最先给了我们指引。科恩用网络理论来模拟生态食物链的结构。当我提到,我们正在试图探究六度分离的理论基础时,他说:“你的意思是小世界问题吧。”科恩让我参考斯坦利·米尔格拉姆的经典作品。
[
上一页 ]
[ :1.70106418e+09 ]
[
下一页 ]