1703956940
1703956941
“有人问我是否能找到‘重篡者’(即历史重篡者或大屠杀否认者)写的东西,”他说,“虽然我对阅读他们的胡言乱语丝毫没兴趣,但我发现浏览他们的网页是一项挑战。”
1703956942
1703956943
因此,他创立了一个能够自动搜索重篡者网页的搜索引擎。当埃克曼的伪谷歌搜索引擎中充斥着反犹太人的言论时,他发现了一个有趣的现象:重篡者的网页频繁地相互链接,形成了一个极易辨认的网络社区。其中只有一个扎眼的异类——一位澳大利亚空中观察员的主页。这个主页上有很多重篡者的链接,但它本身的内容却几乎与大屠杀毫不相关。
1703956944
1703956945
“我担心我的方法错了,”埃克曼回忆道,“但检查过手头那些网页后,我发现那个主页被引用的原因是它指出在奥斯威辛(Auschwitz)的航拍照片中没有发现烟雾。”重篡者是要以此为证据,证明那里没有烧死人。
1703956946
1703956947
埃克曼过去30年所精通的那些数学方法,每一个都有精密的论证和定理支持,但在面对这个新问题的时候,那些方法仿佛跟捕蝶网面对即将到来的飓风般不堪一击。但埃克曼并未放弃,两年后他又发表了一篇关于网络的论文,重点研究电子邮件通信。首先,他收集了一所大学(他拒绝透露这所大学的名字)中上千名学生、教员以及行政人员的电子邮件记录。在这个隐私大于天的时代,搜集这些信息可不那么容易,所以他不想透露资料来源也是可以理解的。但有次来我的研究小组的时候,他很慷慨的跟我们分享了这份记录的匿名版。
1703956948
1703956949
爆发洞察
1703956950
1703956951
2004年春天,当我在灵感四溢的布达城分析这些数据的时候,我得出了一个明确的结论:所有人的电子邮件都不符合泊松过程描述的那种掷硬币般枯燥而刻板的节奏。相反,每个用户的电子邮件模型都跟我的差不多——它们充满了爆发点,就像暴雨频发的夏末天气,在狂轰滥炸般发送了大量邮件之后,总会有长时间的沉默。
1703956952
1703956953
正如我们在前几章看到的,千万不要忽略一个完全随意的模型的偏差,因为它很可能会揭示社会和自然的深层规律。这次的情况就恰恰如此。
1703956954
1703956955
幂律,主宰着我们真实生活的节奏
1703956956
1703956957
在《致命争吵的统计数字》这本研究战争与和平的书中,理查森发现了随意性的一个显著偏差值:冲突的等级数。一些战争的伤亡人数过百万,而另一些战争的死伤人数只有几十个。这种显著的差异促使他使用伤亡总数的以10为底的对数来标示战争的等级。根据他的分级方法,1514年2月28日这天,匈牙利人和奥斯曼土耳其人在贝尔格莱德发生的小冲突属于零级,因为当时只有艾利一人死亡。伤亡人数为10的战争是一级,伤亡人数为100的是二级。我们之前看到的数千名农民军丧生于骑兵和河流之间的战争为三级。
1703956958
1703956959
1703956960
1703956961
1703956962
如果战争真是随机发生的,那么大多数战争的伤亡人数应该都差不多。但理查森发现,1820—1949年之间发生的282次战争中,有188次是三级以下(或死伤人数在千人以下)的小型战争。伤亡人数在1万人左右的战争相对较少——四级战争只有63次。但他还是发现6次六级战争以及两次死伤人数达千万的七级战争。
1703956963
1703956964
大家很容易猜到这两次七级战争是两次世界大战。但那6次死伤人数均达百万的战争可能就不那么出名了。按照时间排列,这些战争分别是:太平天国运动(1851—1864)、西班牙内战(1936—1939)、第一次国共内战(1927—1936)、拉普拉塔大战(the Great War in La Plata,1865—1870)、北美内战(1861—1865),以及十月革命之后的俄国内战(1918—1920)。
1703956965
1703956966
通过观察,理查森发现伤亡人数与战争数量之间的关系遵循着一个简单的数学规律——“越少就越大”。也就是说,大部分战争都是死伤几百人的小型战争,而伤亡人数巨大的大型战役则少之又少。
1703956967
1703956968
理查森并不是第一个发现这一模型的人。19世纪的经济学家维弗雷多·帕累托也发现,大多数人都很穷,而少数人则积累了大部分财富。富人的出现并不令人吃惊,因为即使财富的获取是随机的,还是会有人比较富有。令人吃惊的是,帕累托还发现那些富人的富有程度远远超过了财富随机分配能达到的水平。
1703956969
1703956970
爆发洞察
1703956971
1703956972
理查森和帕累托的研究表明,战争和财富符合幂律分布。具体来讲,很多小事件都是与个别大事件共存的。[1]这意味着,每次世界大战都伴随着无数小战争,而每出现一个比尔·盖茨或洛克菲勒就会有一大群穷人诞生。
1703956973
1703956974
1999年,当我研究网页的出名问题时也跟幂律有过一次亲密接触。我和我的研究团队发现,虽然很多网站都默默无闻,但像谷歌、亚马逊以及雅虎这样的顶级网站总是拥有百万条点击率。我们将这种几支独秀的网络称为“无尺度网络”。在接下来的10年中,我一直在研究各个领域中(从细胞到因特网)的顶尖者在整个复杂体系中的作用。
1703956975
1703956976
爆发洞察
1703956977
1703956978
我的经验告诉我,理查森那句“越少就越大”的箴言实际上是误导。它让人们以为幂律分布的主要特征是大事件或大人物占少数——如世界大战、超级富豪,以及万维网上的佼佼者等,而我们在某种程度上也期望他们越少越好。但事实恰恰相反,我们必须仰仗他们的出现,而泊松的理论将这些异常值禁锢了起来。
1703956979
1703956980
在随机世界中,谷歌和雅虎不会吸引数以百万的点击率;比尔·盖茨也不会聚集亿万财富;战争更不会造成数百万人的伤亡。然而,真实的世界并非如此。
1703956981
1703956982
幂律分布的本质就是它能自然而然地预测出这些稀罕事儿,告诉大家总有严重偏离平均值的异常值。换句话说,一旦幂律出现,我们总能发现异常值。
1703956983
1703956984
幂律出现,爆发点就出现
1703956985
1703956986
我们从埃克曼的数据中得出的结论很简单:他数据库中的所有用户都不符合随机原理。相反,他们使用的模型都一样:短时间频繁发送邮件后就会有长时间(经常是好几天)的停顿。这当然很好理解。我们会参加会议、看电影、约会、吃饭、睡觉,会做许多各种各样的事情,所以我们无法一直待在电脑旁。等到终于有时间查看邮箱,我们肯定会在短时间内发送很多邮件,我们的邮件模型因此而产生了一个爆发点。然后,其他事情会让我们再次离开电脑,这标志着邮件流中下一个休息时间开始了。
1703956987
1703956988
基于这样的生活节奏,人类活动中出现爆发点就不那么稀奇了。有人会说,你的生活方式跟我的大不相同,我们的邮件模型肯定也没有什么相似之处。有些人一周只发几封邮件;有些人一天之内要发上百封;还有些人每天只是扫一眼邮箱;当然,也有些人时时刻刻跟电脑不分离。这就是当人们看到大家的邮件模型都差不多的时候,会觉得那么吃惊的原因。
1703956989
[
上一页 ]
[ :1.70395694e+09 ]
[
下一页 ]