打字猴:1.707630366e+09
1707630366 霍金的派对:从科学天地到数码时代 [:1707629779]
1707630367 霍金的派对:从科学天地到数码时代 2.自然美背后的数学
1707630368
1707630369 那么,约翰孙等人的模型能使我们真正理解冲突概率与死亡人数之间的关联吗?为了探究这一点,让我们把视野稍稍扩大一些。约翰孙等人所发现的冲突概率与死亡人数之间的关联其实不是一种孤立现象,它有一个名称叫做幂律(power law),因为它所涉及的是数学上的幂函数。在大千世界里,幂律的存在是极为普遍的,比如工程领域中的噪声分布,社会领域中的股价涨落、城市规模、科学论文的援引次数、维基百科的作者分布,以及自然领域中生物大小与种类的关联、地震震级与次数的关联、月球上陨石坑的分布等,都在一定范围内、在一定程度上满足幂律。就连巴赫(Johann Sebastian Bach)的勃兰登堡协奏曲(Brandenburg Concerto)的频谱中,也有幂律的身影。幂律的存在范围之广,几乎有超越随机现象中极常见的正态分布(normal distribution)的势头,甚至被某些研究者称为是比正态分布还要正态的分布。
1707630370
1707630371 事实上,约翰孙等人也注意到了,他们所发现的存在于局部冲突中的那些关联,也同样存在于金融领域中。从某种意义上讲,金融家或金融公司在经济领域中的行为与游击队或恐怖组织在策划恐怖攻击时的行为有一定的相似性:大家都在争夺有限的资源,前者是资金,后者——按约翰孙等人的模型——是媒体的版面,而且在基本策略中都包含了通过分析其他团体的行为来避免“撞衫”这一条,以谋求最大的、乃至独有的获利。(5)更相似地是,人们在金融领域中也提出了很多数学模型,它们也具有一定的拟合数据能力,有些甚至还具有赢利能力(相当于预言能力)。但具有警示意义的是,迄今却并无一种金融模型被认为是使我们了解了金融世界的真实机理。
1707630372
1707630373 那么,约翰孙等人的模型会不会也是如此呢?
1707630374
1707630375 这个问题约翰孙自己也想到了,但他认为答案是否定的,因为他们的模型不是单纯的数据拟合,而是建立在对游击队或恐怖组织的社会行为进行合理假设的基础之上的,因而有更大的可信性。
1707630376
1707630377 应该说,这个回答不无道理。从社会角度探索某些幂律的起源确实已成为很多人的研究课题,甚至连物理预印本档案馆arXiv.org也为包含此类探索在内的研究设立了一个类别,叫做物理与社会(Physics and Society),约翰孙等人的早期研究就曾发表在那里。不过在此类研究中成功的范例很少,却有一个失败案例很值得注意。半个多世纪前,美国语言学家齐普夫(George Zipf)在人类语言的词汇分布中,发现了一个幂律,即如果把词汇按使用频率排序,那么使用频率与序号之间几乎恰好成反比,这个幂律被称为齐普夫定律(Zipf’s law)。这个幂律的起源是什么呢?齐普夫进行了研究,他的研究也正是从社会角度入手的。但后来人们发现,齐普夫定律其实并不是人类语言所特有的。事实上,如果给猴子一台打字机,让它随意敲打一个带空格键的键盘,并假定每个字母键被敲到的概率相同,那么猴子敲出的“词汇”也会满足齐普夫定律。因此,齐普夫定律与其说是存在社会起源,不如说更有可能只是随机现象中一个单纯的数学规律,就像随机现象中无处不在的正态分布一样,齐普夫从社会角度入手的研究貌似合理,其实是误入歧途了。
1707630378
1707630379 虽然我们不能据此认为约翰孙的研究也是如此,但幂律所具有的异乎寻常的普适性,本身就意味着很多模型都有可能导致幂律,从而无法凭借一个模型对结果的拟合来轻易推断模型本身的有效性,这一点是我们看待此类研究时应有的谨慎。
1707630380
1707630381 在结束本文之前,让我们再谈几句幂律。迄今为止,幂律的起源还是一个谜,不过在幂律中有一个基本特点早就引起了人们的注意,那就是所谓的标度不变性,即描述数据所用的单位无论怎么改变(比如长度单位无论是用毫米、米,还是千米),幂律都不受影响(即幂次不变)。那么什么样的系统存在标度不变性呢?主要有两类:一类是不存在内在尺度的系统,另一类则是存在许多不同内在尺度的系统,前者通常满足严格的幂律,后者则通常满足近似的幂律。幂律存在得如此普遍,在很大程度上是因为后者。著名的分形理论专家曼得布洛特(Benoît Mandelbrot)曾经说过,一座山脉要想有趣,就必须在许多不同尺度上都有景观(峰、谷、悬崖、裂缝等)。这是自然美的一个重要组成部分,也是幂律出现的土壤。
1707630382
1707630383 约翰孙等人的模型是否有效或许还有待进一步评估,但那模型背后的幂律天地里存在许多值得探索的问题则是毫无疑问的。
1707630384
1707630385 (1) 本文的删节版发表于《科学画报》2011年第1期(上海科学技术出版社出版),发表稿的标题为“战争可以预测吗”。
1707630386
1707630387 (2) 这项工作的很大部分早在2005—2006年间就完成了,不过没有发表在知名刊物上,而2009年的工作由于发表在《自然》(Nature)杂志上,从而引起了广泛关注。
1707630388
1707630389 (3) 里查德逊所研究的是正规战争,得到的幂次是1.5,不同于约翰孙等人的结果,这表明正规战争与局部冲突存在系统差异。本文所谓的“预测”战争只是沿袭媒体用语,实际上是“预测”局部冲突。
1707630390
1707630391 (4) 厄尔法罗酒吧问题是关于一群人选择是否去酒吧的博弈问题,选择的基本策略是避免在酒吧过于拥挤时前往,这跟约翰孙等人的模型中游击队或恐怖组织避免在媒体版面已被占满时发动攻击十分类似。
1707630392
1707630393 (5) 这种对比有点对不住金融家们,但它并非本文的独创,约翰孙等人及很多媒体都做过这种对比。
1707630394
1707630395
1707630396
1707630397
1707630398 霍金的派对:从科学天地到数码时代 [:1707629780]
1707630399 霍金的派对:从科学天地到数码时代 第二部分 创新点滴
1707630400
1707630401 霍金的派对:从科学天地到数码时代 [:1707629781]
1707630402 流言止于熟人?(1)
1707630403
1707630404
1707630405
1707630406
1707630407 在拙作《竹筏还是灯塔——数据洪流中的科学方法》(2)中,我曾写道:“互联网既是信息库,也是垃圾场。”在这“垃圾场”中,有一类“垃圾”具有很大的影响力,那就是流言。互联网上的流言是如此众多,我们不仅时常能够听到,甚至很可能曾在有意无意中传播过它。
1707630408
1707630409 无论可靠的信息还是流言,都是数量巨大且深具影响力的。它们究竟是如何传播的呢?这个问题几十年来吸引过不少人的关注,心理学家、社会学家、统计学家等都对信息或流言的传播进行过研究,其中比较著名的是美国社会学家格兰诺维特(Mark Granovetter)的研究。在那项发表于1973年的研究中,格兰诺维特对人与人之间的关系进行了分类,将关系疏远的称为弱联系(weak tie),关系密切的称为强联系(strong tie)。在这基础上他提出了一个结论,那就是信息的传播主要依靠弱联系——或者换句话说,信息主要是通过关系疏远的人传播的。
1707630410
1707630411 这一结论多少有些出人意料,因为在直觉上,关系密切的人——即所谓的强联系——似乎才是更主要的信息来源。不过比结论更出人意料的乃是结论背后的数据。那数据——你相信吗——仅仅来自对经由朋友介绍而找到工作的几十人的采访。通过采访,格兰诺维特发现那些人多数是经由较为疏远的朋友(即弱联系)的介绍而找到工作的,于是就做出了信息的传播主要依靠弱联系这一结论。在并不面临实质困难的情形下,采集的数据如此稀少(只有几十),选取的例子如此特殊(只是找工作),做出的结论却如此宏大(针对信息的传播),这样的研究虽一度遭到拒稿,最终却以《弱联系的力量》(The Strength of Weak Ties)为题发表在了《美国社会学杂志》(American Journal of Sociology)上,并成为了引用数超过23000的经典论文,这恐怕是社会科学独有的奇迹。
1707630412
1707630413 不过,经典自有经典的魅力。2013年3月,美国东北大学(Northeastern University)的研究者卡塞(Marton Karsai)等人的一项新研究将那篇40年前的经典重新推上了新闻频道。卡塞等人注意到,信息传播领域的研究有一个传统的局限性,那就是所涉及的大都是对时间平均后的静态数据。为了突破这一局限性,他们决定对动态数据展开研究。为此,他们采用了某个欧洲国家几百万人之间数以亿计的手机通话记录,那些记录每一条都标有时间,从而很便于研究信息传播的动态过程。
1707630414
1707630415 经过研究,卡塞等人提出了一个新的结论,那就是强联系对信息或流言的传播有着阻碍作用,不仅会减慢传播速度,而且还会减小传播范围。这个结论与格兰诺维特早年的结论,即信息的传播主要依靠弱联系,可以说是互补的——当然,也同样有些出人意料。不过社会科学中的很多东西,当你有了结论之后,往往总能找到定性的说法来“解读”。拿卡塞等人的观点来说,那“解读”就是:关系密切的人乃是熟人,熟人往往形成圈子,从而使信息的传播局限在圈子里——或者换句话说,通过强联系传播的信息往往会局限在由强联系组成的子网络中。听起来有几分道理,却又不尽然,作为“解读”恐怕就只能如此了。
[ 上一页 ]  [ :1.707630366e+09 ]  [ 下一页 ]