打字猴:1.70106419e+09
1701064190
1701064191 这一论点突出了理解更普遍意义上的重叠的重要性。网络中重叠的平均数量通过第二个统计量进行量化,这个统计量就是“集群”(clustering),集群的定义是连接到同一节点的两个节点彼此互相连接的概率(就人而论,即朋友的朋友彼此也是朋友的概率)。在上文讨论的两种极端模型中,集群的变化范围相当大,初始圆环的集群高达0.75,随机网络的集群则低至六百万分之一。
1701064192
1701064193 为了计算出0.75这个数字的来源,你需要意识到,圆环中你和你身边的人的所有朋友几乎都是相同的(精确地说,是1 000个朋友中的998个都相同),你和与你最亲近的那个人的朋友重叠率几乎等于1。另一方面,和你最遥远的朋友,即距离你500步的那个朋友之间,你们仅仅共享大约一半的朋友(他们是圆环上碰巧被夹在你们中间的499人),所以你与最遥远的人的重叠率是499/1 000,约等于1/2。对于其他介于最近和最远之间的朋友,重叠率从1/2平滑地变成1,平均数为3/4,这就是集群为0.75的由来。下一步,我们可以应用类似的、但稍容易的推理来计算随机连接的情况,集群的推理结果应该等于六百万分之一。如果你充满好奇心,计算它会是一件很有乐趣的事情。但请你不要迷失在这些细节中。这里的关键点只是平均路径长度,随着我们将网络从谱线的一端变换到另一端,集群几乎变化了数百万倍。
1701064194
1701064195 虽然平均路径长度和集群这两个统计量的数值因一个相似因素而下降,但是它们体现了网络体系结构中非常不同的侧面。平均路径长度反映了全局结构;它取决于整个网络的连接方式,这无法从任何局部测量推断出来。集群反映了局部结构,它只取决于典型的邻居之间的相互连接,节点之间的关系纽带连接到了一个共同的中心。粗略地讲,平均路径长度决定了网络的大小,集群决定了裙带关系的强弱。
1701064196
1701064197 ◎  ◎  ◎
1701064198
1701064199 到目前为止,我们已经分析了网络频谱的两个极端。但是我们仍然不清楚中间发生的事情。两个端点告诉我们,变换通过某种方式使圆环大大收缩,并破坏了它的集群。我们尚不知晓的是,这种变化是渐进的还是突发的。瓦茨和我都不知道如何用纯数学来解决这个问题,所以我们用电脑模拟巨大但可控范围内的网络变换,我们从有1 000个节点、每个节点有10条边的原始环开始。为了描绘出中间地带的结构变化,我们将平均路径长度和集群作为随机重连的边所占比例的函数,绘制出了它们的函数图像。
1701064200
1701064201 我们发现的结论十分惊人。即便是最微小的随机性也会使网络大幅收缩,导致平均路径长度开始暴跌。仅仅1%的重连(意味着每100条边中只有1条是随机的),平均路径长度就从原始水平下降了85%。进一步的重连只有极小的影响;曲线慢慢地下降到了一个平稳状态,表明网络已经收缩到了它所能达到的最小水平,仿佛它是完全随机的。与此同时,集群几乎没有任何变化。对于1%的重连,集群只下降了3%。连接从秩序井然的临近街坊中间被拉了出来,然而,集群几乎不受影响。只有在变换的晚期,平均路径长度塌缩很久以后,集群才开始显著下降。
1701064202
1701064203 我们可以很直观地解释这些结果。在变换开始时,最先重连的边充当了网络中相距遥远部分之间的捷径。它们之所以会打破平衡,是因为一种强大的非线性效应:它们不仅把两个节点连到了一起,而且把整个世界拉到了一起。例如,我喜欢在网络国际象棋俱乐部在线下棋,在那里,我同荷兰一家杂志社的编辑艾米洛成为朋友。由于这个捷径,我同他接近了很多,而且也同其他成千上万的荷兰人接近了很多,包括他所有的朋友,以及朋友的朋友。尽管我的朋友并未意识到,但实际上通过我和艾米洛创造的捷径,他们已经同艾米洛和艾米洛的朋友们更接近了。这座桥梁发挥了巨大的作用。
1701064204
1701064205 在我们的模拟中,最初的新捷径大大缩减了世界的规模,但对集群的影响要小得多。这意味着对于局部而言,变化成小世界是基本无法被检测到的。如果你经历了变换,你的直接邻居根本不会告诉你世界已经变小了。你的朋友数量仍然相同,这与他们是否将你连接到了更大的圈子完全无关。在这样的世界里,人们可能会认为不会受到类似艾滋病这样的疾病的威胁,他们的理由是:他们的性伴侣都不在高危人群中,然而在现实中,他们或许只与艾滋病病毒携带者相隔一两步。
1701064206
1701064207 这种模拟最重要的结果是,在重连过程中的广阔中间状态中,模型网络集群性很高,同时规模又很小。这种奇特的组合在数学上是新奇的。在传统网络中,规模大小和集群密切相关。随机网络规模很小,集群性很低;规则网络规模很大,集群性很高。重新连接的网络却设法让规模小和高度集群二者同时发生。
1701064208
1701064209 我们将拥有这对看似矛盾属性的网络称为“小世界网络”,人际关系之间也存在与之极为相似的矛盾,我们在紧密的圈子中运动,而全世界的人却都被非常短的关系连接到了一起。现在的问题是:大自然能否利用这种网络结构的特殊形式?如果能的话,目的又是什么?
1701064210
1701064211 ◎  ◎  ◎
1701064212
1701064213 我们的模拟表明,小世界连接可能广泛存在于真实网络中,因为只需要有一小部分的捷径就足够了。为了验证这种假设,我们需要实证的例子,但这并不容易寻找。任何一个备选的例子都必须具备充分的特点,它的接线图的每一个细节我们都必须了解,每个节点和边都必须有翔实的记录,否则我们无法计算集群和平均路径长度。
1701064214
1701064215 此时,我想到了自己一年前在混沌课程中遇到的学生裴昆艺(Koeunyi Bae),裴昆艺曾做过一个关于美国西部电网的项目,项目里大约5 000座发电厂通过高压输电线连接在一起,输电线横跨落基山脉西部,进入加拿大西部的省份。裴昆艺和她的导师吉姆·索普为瓦茨提供了数据。数据包含了大量的详细信息,这些信息对工程师至关重要,例如输电线的耐压容量,节点按照变压器、变电站或发电机的分类等,但我们忽略了除了连接以外的一切信息。网格变成了一个个点通过边连接的抽象模式。为了检查电网是否是小世界网络,我们将它的集群和平均路径长度与具有相同数量的节点和边的随机网络进行比较。正如预测的那样,真实网络几乎与随机网络规模一样小,但是集群要高很多。具体而言,其平均路径长度仅是随机网络的1.5倍,而集群则是随机网络的16倍。
1701064216
1701064217 接下来,让我们从技术网络转向生物网络,我们来观察一种被称为秀丽线虫的小蠕虫的神经系统。对于这种卑微的生物,我们了解得比其他动物更多,甚至超过遗传学家的果蝇和肿瘤科医生的小鼠。秀丽线虫是一种透明的、土壤生的线虫,体长仅1毫米。我们已经绘制出这种蠕虫的全部959个细胞从受精到死亡每个阶段的图样。早在1998年,对秀丽线虫的全基因组测序就已经完成。这种生物看起来深奥,但对它的研究已经阐明了几个基本的细胞过程,从细胞死亡,到细胞信号传导,再到神经轴突导向,所有这些都是由蠕虫生物学家率先发现的,后来证明对人类有意义。这正是为什么人们十分关注秀丽线虫的原因:它或许是与人类共享诸多必不可少的生命过程的最简单的生物。
1701064218
1701064219 对我们而言,秀丽线虫的吸引力是它的神经系统已经被完全描绘出来,这是在任何其他生物上都尚未实现的壮举。事实上,秀丽线虫的302个神经元的接线图都存储在了电脑上。和电网一样,我们将神经元视为完全相同的(尽管生物学家区分出了118种不同类别的神经元),如果两个神经元被突触(化学连接)或缝隙连接(电子连接)联系起来,我们就认为这两个神经元是相连的。
1701064220
1701064221 结果证明,由此产生的抽象网络又是一个小世界。它的平均路径长度仅比对应的随机网络长18%,而它的集群却是随机网络的6倍。这意味着什么我们还不清楚,或许是较短的平均路径长度有利于生物全身的快速通信,尽管高度集群可能反映了反馈回路的存在和神经系统中的模块化结构。
1701064222
1701064223 电网和神经系统是两个完全不同的网络:一个由人类创造,另一个是进化而来。一个是有史以来建造的最庞大的机器之一,由成千上万公里的电缆连接的同步发电机组成的庞大网络;另一个是显微镜下的精致物品,数百万年的自然选择的产物,蜷伏在蠕虫身体中的网络。虽然二者差异巨大,但是它们的结构却惊人的相似。二者都达到了可能的最小规模。二者都是高度结构化的,绝不是随机的。诚然,我们的近似假设模糊了对这些研究结果的解释力——两种网络的小世界结构可能与它们的功能无关,因此毫无意义。但时间会说明一切,至少从现在来看,这种巧合是诱人的。
1701064224
1701064225 ◎  ◎  ◎
1701064226
1701064227 社交网络似乎也是小世界,尽管我们没有意识到任何超越趣闻轶事的证据。特别是,我们想知道,六度分离的概念是否基于可验证的真实数据。或许它只是坊间传言而已。约翰·古尔自己无从知道,他认为它可能是来自无线电报的发明人古列尔莫·马可尼(Guglielmo Marconi),退回到那段岁月里,马可尼用电报站连接了整个地球。如果没有真实的数据,我们无法确定我们的理论是否像我们所预测的那样广泛适用。它也像适用于电网和神经系统一样适用于人类的社交网络吗?
1701064228
1701064229 与洛克菲勒大学的数学生物学家乔尔·科恩(Joel Cohen)的一次谈话最先给了我们指引。科恩用网络理论来模拟生态食物链的结构。当我提到,我们正在试图探究六度分离的理论基础时,他说:“你的意思是小世界问题吧。”科恩让我参考斯坦利·米尔格拉姆的经典作品。
1701064230
1701064231 1967年,哈佛大学社会心理学家米尔格拉姆设计了一个实验,以测试美国社会是更像一群毫无联系的孤岛,还是更像一张巨大的连锁网络。实验的目的是跟踪随机选择的美国人之间的一系列相识的人。米尔格拉姆给了人脉链起点的那个人一个文件夹(那是一个令人印象深刻的小册子,有点儿像护照,上面印有哈佛印章),里面有命令,将它送给指定的目标人物,但又有一条要求:“如果你不认识目标人物,不要企图直接联系他。而是要将这个文件夹送给看上去比你更了解目标人物的熟人,这个熟人必须是你能亲密到直呼其名的程度。”这样,文件夹便会在熟人之间传遍全美国,渐渐接近目标。为了开启关系链,米尔格拉姆招募来自美国中西部的志愿者,他后来解释道:“作为一个自然的开始,我认为最好选择遥远的城市作为起点,例如堪萨斯州的威奇托或内布拉斯加州的奥马哈(从坎布里奇看去,这些城市似乎隐约‘在外面’,在大平原或某处)。”内布拉斯加州的实验涉及160名起始者,所有人都试图接触到相同的目标人物,目标人物是一名股票经纪人,住在马萨诸塞州的沙仑,在波士顿工作。当时,米尔格拉姆不相信任何一条关系链会成功,也不知道它们会需要多少步才能成功。“当我问一个聪明的朋友,这个实验需要花费多少步时,他估计从内布拉斯加到沙仑至少需要100步以上。”米尔格拉姆写道。
1701064232
1701064233 实验的结果让人大跌眼镜:44个文件夹只通过2~10名中间人就成功传递到目标人物手中。中间人的中位数是5,对应链条中的6个节点——即流行的“六度分离”中的数字。其他关系链没有成功,是因为有些人不愿意合作并放弃传递文件夹。
1701064234
1701064235 正如这些有趣的结果显示,它们仍然是不确定的。这些关系链可能都不是最短的,因此真正的平均路径长度无法估计。它甚至可能是无限的:可能有生活在不可逾越的社交圈子中的两个人,他们之间没有关系链。如果没有更多关于网络局部连接的信息,我们就不可能计算它的集群。要回答这些更详细的问题,我们还是需要找到一个社会网络,其特征被完全描绘出来,每个节点和边都有不容置疑的记录。
1701064236
1701064237 数学家们曾打趣地开始了一次这样的枚举,他们的圈子以匈牙利学者保罗·厄尔多斯为中心,厄尔多斯在日常生活的各个方面都完全不称职,他甚至不会(或是不愿意)在自己的吐司上抹黄油。然而,厄尔多斯却拥有20世纪最丰富和最具创造性的数学头脑。他喜爱安非他明(一种合成的兴奋剂),拎着他那破旧的手提箱漫游世界,他会出现在你的家门口,并宣称“我的大脑是敞开的”,这意味着他准备好了帮你解决数学问题。
1701064238
1701064239 厄尔多斯与许多人合作过,所以数学家之间计算各自的“厄尔多斯数”成为流行的游戏。如果你是少数几个有幸同厄尔多斯一起撰写过论文的人之一(这类人有507位),你的厄尔多斯数即为1。如果你并未同厄尔多斯一起写过论文,但你同和他一起写过论文的人写过,那么你的厄尔多斯数为2。数学界的笑话是,谁的厄尔多斯数会大于等于2。有一个网站列出了所有厄尔多斯数为1或2的幸运者,但没有列出厄尔多斯数为3的人。因为厄尔多斯数为3的人是海量的。我就是其中之一。如果没有完整的名单,我们就无法计算这个社交网络的平均路径长度和集群。结果证明,人类社交网络难以捉摸到了让人崩溃的地步。
[ 上一页 ]  [ :1.70106419e+09 ]  [ 下一页 ]