1703956973
1703956974
1999年,当我研究网页的出名问题时也跟幂律有过一次亲密接触。我和我的研究团队发现,虽然很多网站都默默无闻,但像谷歌、亚马逊以及雅虎这样的顶级网站总是拥有百万条点击率。我们将这种几支独秀的网络称为“无尺度网络”。在接下来的10年中,我一直在研究各个领域中(从细胞到因特网)的顶尖者在整个复杂体系中的作用。
1703956975
1703956976
爆发洞察
1703956977
1703956978
我的经验告诉我,理查森那句“越少就越大”的箴言实际上是误导。它让人们以为幂律分布的主要特征是大事件或大人物占少数——如世界大战、超级富豪,以及万维网上的佼佼者等,而我们在某种程度上也期望他们越少越好。但事实恰恰相反,我们必须仰仗他们的出现,而泊松的理论将这些异常值禁锢了起来。
1703956979
1703956980
在随机世界中,谷歌和雅虎不会吸引数以百万的点击率;比尔·盖茨也不会聚集亿万财富;战争更不会造成数百万人的伤亡。然而,真实的世界并非如此。
1703956981
1703956982
幂律分布的本质就是它能自然而然地预测出这些稀罕事儿,告诉大家总有严重偏离平均值的异常值。换句话说,一旦幂律出现,我们总能发现异常值。
1703956983
1703956984
幂律出现,爆发点就出现
1703956985
1703956986
我们从埃克曼的数据中得出的结论很简单:他数据库中的所有用户都不符合随机原理。相反,他们使用的模型都一样:短时间频繁发送邮件后就会有长时间(经常是好几天)的停顿。这当然很好理解。我们会参加会议、看电影、约会、吃饭、睡觉,会做许多各种各样的事情,所以我们无法一直待在电脑旁。等到终于有时间查看邮箱,我们肯定会在短时间内发送很多邮件,我们的邮件模型因此而产生了一个爆发点。然后,其他事情会让我们再次离开电脑,这标志着邮件流中下一个休息时间开始了。
1703956987
1703956988
基于这样的生活节奏,人类活动中出现爆发点就不那么稀奇了。有人会说,你的生活方式跟我的大不相同,我们的邮件模型肯定也没有什么相似之处。有些人一周只发几封邮件;有些人一天之内要发上百封;还有些人每天只是扫一眼邮箱;当然,也有些人时时刻刻跟电脑不分离。这就是当人们看到大家的邮件模型都差不多的时候,会觉得那么吃惊的原因。
1703956989
1703956990
事实上,当我们检查同一个人每次连续发送邮件之间的时间间隔时,没有人遵循我们熟知的泊松分布。相反,不管是谁,他的模型都符合幂律分布。
1703956991
1703956992
爆发洞察
1703956993
1703956994
一旦幂律出现,爆发点的出现就在所难免。实际上,幂律预测出大部分邮件都是在短时间内连续发送的,所以我们的邮件模型中出现了一个爆发点。同时,它也预见了人们会数小时或数天不发邮件。跟理查森资料中少有的大型战役,以及帕累托分析的少数富豪是一样的道理,最终,我们的邮件模型遵循着一种内在和谐,短时间的活跃和长时间的耽搁相互交替,形成的一个精确的规律,一个我们从未想到,也不用花费力气去遵守,甚至一开始人们认为其并不存在的规律。
1703956995
1703956996
人类行为遵循共同的幂律分布
1703956997
1703956998
那又怎样呢?且不说你的生活不只是围着邮件转,就算是,谁又会在乎它们遵循什么数学规律呢?若我们在认为这一切都是随意为之时并未感到困扰,那为什么在知道了它们不是随意发生的时候会耿耿于怀呢?
1703956999
1703957000
反过来想,这种爆发吸引人的主要原因就是它不只适用于我们的邮件模型。比方说,在浏览那些我们感兴趣的网站时,我们通常会先点击几个链接,看几篇文章,在上面停留几分钟后再离开。我们很难相信这种随性而又随意的模型遵循什么内在规律,但事实是它确实遵守了。当我的研究小组在测量一个用户在一个网站上连续点击链接的时间间隔时,幂律规律再次映入我们的眼帘。
1703957001
1703957002
受到邮件模型与网页浏览习惯具有相似性的激励,我开始搜集其他人类行为中的信息。
1703957003
1703957004
1703957005
1703957006
1703957007
不久之后,我发现伦敦帝国理工学院(Imperial College)的物理学家玛雅·帕祖斯基(Maya Paczusky)和她的学生乌利·哈德尔(Uli Harder)正在研究人们打印资料的时间间隔。爆发点再次出现:我们会在短时间内打印很多资料,然后又转向其他日常事务。
1703957008
1703957009
圣母大学的赫斯伯格图书馆(The Hesburgh Library)慷慨地为我们提供了学校学生和教师们借书的详细记录。跟联邦调查局不同,我们不关心大家都读了什么书,只关心每位读者来图书馆的时间。爆发点又一次出现了:一个典型的读者会在几个小时内查阅多本书——可能是为某堂课或是某份论文做准备。然后有很长一段时间都不出现,就像他完全忘掉图书馆这回事儿一样。
1703957010
1703957011
我们打电话的模型也差不多。短时间内我们会打多通电话,然后在很长时间内一通都不打。我们之前提到了一位周游世界的朋友哈桑·伊拉希。我们从他记录自己行踪的数千张照片上发现了时间戳。幂律分布再次出现:哈桑在短时间内照了很多张照片,然后就像照相机丢了般,一连几个小时甚至几天都不拍一张。这当然会引起联邦调查局的怀疑——这段期间他去了哪儿呢?
1703957012
1703957013
爆发洞察
1703957014
1703957015
不论我们观察哪种人类活动,都会发现相同的“爆发”理论:长时间休息之后就会出现短时间的密集活动,就像贝多芬音乐中悦耳的小提琴声被雷鸣般的鼓声打断一样。事实上,从人们对维基百科的编辑,到货币经纪公司的交易;从人和动物的睡眠模型,到魔术师为了保证魔杖时刻停留在空中而做的小动作,所有的一切都证明,爆发,无处不在。
1703957016
1703957017
我们的研究不再单纯地局限于电子邮件或是网络浏览器,而是要见证人类活动中某种更深层次的联系。这种联系清楚地表明,我们的活动不再是随意为之。就其本身而言,这并不怎么令人吃惊,因为没有人会认为自己受偶然性主导。
1703957018
1703957019
每个人的意志都是自由的,这使得所有事情——包括电子邮件、打印资料以及网络浏览等,都变得复杂了起来。不过,不管我们做了什么,我们都不知不觉地遵循着一个规律——幂律规律。理论上虽很简单,但实际上确实令人吃惊。
1703957020
1703957021
爆发改变了一切
1703957022
[
上一页 ]
[ :1.703956973e+09 ]
[
下一页 ]