打字猴:1.70395689e+09
1703956890
1703956891
1703956892 爆发:大数据时代预见未来的新思维 [:1703955571]
1703956893 爆发:大数据时代预见未来的新思维 第二部分 爆发,大数据时代的新思维
1703956894
1703956895 爆发:大数据时代预见未来的新思维 [:1703955572]
1703956896 第5章 爆发,无处不在
1703956897
1703956898 爆发:大数据时代预见未来的新思维 [:1703955573]
1703956899 爆发的本质规律:幂律分布
1703956900
1703956901 长时间休息之后就会出现短时间的密集活动,就像贝多芬音乐中悦耳的小提琴声被雷鸣般的鼓声打断一样。事实上,从人们对维基百科的编辑,到货币经纪公司的交易;从人和动物的睡眠模式,到魔术师为了保证魔杖时刻停留在空中而做的小动作,所有的一切都证明:爆发,无处不在。
1703956902
1703956903 当希特勒开始在政治舞台崭露头角时,早已超过服兵役年龄的刘易斯·弗赖伊·理查森已经从救护小组中退了出来,在佩斯里工业学院(Paisley Technical College)舒舒服服当上了校长。面对德国的军事野心,饱受困扰的理查森在1940年做出了一个惊人的决定。他辞去了校长职务,选择靠微薄的养老金度过余生。他想专心研究一个问题,而且认为为这项研究放弃丰厚的收入是值得的:他想找出影响战争的规律。
1703956904
1703956905 理查森坚信,如果他掌握了产生冲突的原理,就能预防流血事件的进一步发生。他将调查结果记录在他的第二本书《致命争吵的统计数字》(Statistics of Deadly Quarrels)中。跟他第一本研究天气预报的大部头一样,这本书也是连篇累牍,通篇充斥着讨论、公式以及方程式。不过,用这种方法研究有关战争的课题实属罕见。“我认为这是一本数学专著,”跟他同时代的一个人说,“虽然他的研究对象很奇特——就是这项研究使他得到了科学怪人的绰号。”
1703956906
1703956907 毫无疑问,没有一家出版社愿意冒险出版理查森这本离奇的书。直到他去世7年后,这本书才终于出版,但只证明了他预测战争的计划跟预测天气一样,完全失败了。
1703956908
1703956909 理查森将1820—1949年发生的所有知名战争和冲突详细地编纂入目,并一丝不苟地记录了相关细节,比如伤亡人数和参战者的宗教信仰等。他的目标是将专家们发现的战争的传统诱因量化。
1703956910
1703956911 ●经济实力相差悬殊的国家之间是不是更容易发生战争?
1703956912
1703956913 ●有共同语言的群体之间是否不易起争端?
1703956914
1703956915 ●军备竞赛是不是战争发生的前兆?
1703956916
1703956917 ●同样憎恶第三方的两方是否不那么容易打起来?
1703956918
1703956919 这些都是战争理论的基本假设,但理查森偏要用高深的数学知识证明它们。最后,他并没有解答出任何一个问题,而是证明了它们都不过是迷思和误解。然后,他以一种近乎残酷的坚定语气总结了自己的研究:“通过这项不朽的研究,我发现几乎没有一项新技术能够找出战争的起因。”数据显示,战争和争端只不过是偶然事件。
1703956920
1703956921 我的电子邮件流
1703956922
1703956923 我倾向于认为,我发的每封电子邮件都是有目的的,所以发送时间绝对不是随意的。不过,我必须承认对不明就里的旁观者来说,我在2006年8月18日星期五那天发的一系列电子邮件都是随意为之。
1703956924
1703956925 第一封邮件是在上午8点49分发出,另外31封的发送时间分别为:9点46分,9点49分,10点38分,11点49分,11点49分,11点53分,11点57分,13点46分,13点47分,13点48分,13点59分,14点41分,14点56分,14点58分,14点59分,15点18分,15点20分,15点30分,15点53分,15点58分,16点05分,16点05分,16点07分,16点37分,16点42分,16点52分,17点05分,17点06分,18点16分,18点16分,以及18点19分。
1703956926
1703956927 它们只是一系列很容易由随机数生成程序生成的时间戳。如果真是这样,那我的邮件发送模型应该完全符合泊松过程,一种建立在我们所做的每件事都是由偶然驱使的假设基础上的随机事件增量过程。但这一组时间戳真的是随机的吗?
1703956928
1703956929 最初5封邮件中的第一封是在8点49分给一个博士后助理的回复,最后一封是11点49分发出的,主要内容是我一早上的工作成果。这完全符合泊松过程:3个小时内发5封邮件,每两封之间的时间间隔大约是45分钟。而8分钟后,在11点49分和11点57分之间,我又连着发出了4封邮件,内容都跟我早上的工作相关。根据泊松公式,在一连串随意发送的邮件中,一封接一封快速发送的可能性仅为0.000035——也就是说,这种情况每5个月才会出现一次。也许,那个8月中旬的星期五不怎么普通。
1703956930
1703956931 11点57分之后,情况变得正常起来。由于要骑车去学校,再加上午餐,我离开了电脑一会儿。但从14点41分开始,我又破了纪录,在接下来的71分钟里发了11封邮件。照目前的情况看,这没什么了不起。但如果假设我的行为模型是随意的,根据泊松理论,我这种连珠炮般快速发送邮件的行为要1026年才会发生一次。鉴于我们推测出宇宙寿命只有1010年,我那天确实做了件了不起的事。
1703956932
1703956933 实际上,那个星期五真的没什么特别之处。如果电脑没有记录我的邮件信息,那天只是再平常不过的一天,事后我也不会记得那天发生了什么事。而且,我的邮件模型也没什么特殊,因为如果我检查一下其他日子的记录,就会发现情况都差不多。
1703956934
1703956935 问题是,如果人类行为是随意的话,我的电子邮件流就会均匀分布,但我的通信情况却并非如此。相反,不管是哪一天,在长时间没发邮件之后的一小段时间内,我就会发送大量邮件。事实上,不管哪天检查,我发送邮件的次序都不是随意的,从来都不是。相反,它们往往充满了爆发点(bursts)。
1703956936
1703956937 爆发点的出现
1703956938
1703956939 20世纪80年代后期,我还在布加勒斯特大学(University of Bucharest)读书,就开始阅读有关混沌理论的书籍,并成了瑞士数学物理学家让-皮埃尔·埃克曼(Jean-Pierre Eckmann)的粉丝。在他的开拓性研究生涯中,埃克曼成功地将混沌整理成章。他将蝴蝶效应严密化,用无数定律加以证明,而证明过程只有少数能够跟上他那高深复杂的数学语言的专家才能完全理解。2000年左右,在他写出那本名为《混沌现象和奇异吸引子的遍历理论》(Ergodic Theory of Chaos and Strange Attractors)的书后,埃克曼的研究出现了意想不到的转折。
[ 上一页 ]  [ :1.70395689e+09 ]  [ 下一页 ]