打字猴:1.70106819e+09
1701068190
1701068191 研究组坚持自己的立场,他们对吹毛求疵的批评意见感到沮丧。  [277]  韦斯特说:“我的内心不会向这些在我脚边乱吠的小狗屈服  [278]  。”不过研究组还是认为,有这么多批评意见不是坏事——不管他们到底怎么认为,毕竟有很多人在关注代谢比例理论。并且,就像我在前面提到的,怀疑是科学家们最重要的职责,越是杰出而有雄心的理论,越是会受到质疑。
1701068192
1701068193 争议不会很快平息;牛顿的引力理论提出来60年后都没有被广泛认可,许多最重要的科学进展都曾有类似的经历。现在我们能说的是,代谢比例理论非常有趣,应用范围很广,也得到了一些实验数据的支持。生态学家穆勒—兰道(Helene Müller-Landau)评论道:“我想韦斯特和恩奎斯特等人不会一直重复他们的观点,  [279]  批评者也不会一直重复他们的质疑,随着时间流逝,证据的天平最终会倒向胜利的一边。”
1701068194
1701068195 复杂 [:1701064834]
1701068196 幂律的未解之谜
1701068197
1701068198 在前一章和这一章我们看到了许多幂律。除了这些,在城市规模、收入、地震、心率变化、森林火灾和股市波动等现象中都发现了幂律分布,这还只是其中一小部分。
1701068199
1701068200 第15章曾讲过,科学家们一般都假定大部分自然现象都服从钟形曲线或者说正态分布。然而幂律却在很多现象中都有被发现,以至于一些科学家说它“比‘正态’还要正态”。  [280]  用数学家维林格(Walter Willinger)和他同事的话说:“在复杂的自然和工程系统中获得的数据中发现(幂律)分布,应当视为正常而不是意外。”
1701068201
1701068202 科学家们对自然界中钟形曲线分布的成因有很好的理解,但幂律在一定程度上却还是个谜。我们已经看到,对于自然界中观察到的幂律有各种解释(例如,偏好附连、分形结构、自组织临界性、高度容错等等),对于是哪种机制导致了幂律现象很少有共识。
1701068203
1701068204 20世纪30年代早期,哈佛语言学教授齐普夫(George Kingsley Zipf)在一本书中介绍了语言的许多有趣属性。随意在小说或报纸中取一大段文字,将所有词根据出现次数排序。例如,下面是莎士比亚戏剧《哈姆雷特》的独白“生存还是毁灭”中的词频表:
1701068205
1701068206
1701068207
1701068208
1701068209
1701068210
1701068211
1701068212 根据词频降序排列,频数最高的词排第一(“the”),频数第二高的词排第二,等等。一些词的频数一样(例如,“a”和“sleep”都出现了5次),对于这种情况随机排序。
1701068213
1701068214 在图17.5中画出了“生存还是毁灭”的词频与排名的关系。图的形状接近幂律。如果选取的文本更多,图形会更接近幂律。
1701068215
1701068216 齐普夫用这种方法分析了大量文本(没有借助计算机),他发现,对于大规模文本,词频大致正比于其排名的倒数(也就是1/排名)。这是指数为-1的幂律。排名第二的词的频数大约是排第一的词的一半,第三大约是1/3,等等。这个关系现在被称为齐普夫定律  [281]  (Zipf’s law),这可能是最著名的幂律。
1701068217
1701068218
1701068219
1701068220
1701068221 ▲图17.5 齐普夫定律,以莎士比亚的独白“生存还是毁灭”为例
1701068222
1701068223 对齐普夫定律有各种解释,齐普夫自己提出,一方面,人们一般都遵循“最省力原则(Principle of Least Effort)”:一旦用到了某个词,对类似的意思再用这个词就比换其他词要省力。另一方面,人们希望语言没有歧义,这又需要用不同的词来表示相似却又不完全一样的意思。齐普夫从数学上证明了这两种倾向在一起会产生观察到的幂律分布。
1701068224
1701068225 20世纪50年代,因发现分形而闻名的曼德布罗特从信息量的角度提出了不同的解释  [282]  。借鉴香农的信息论(参见第3章),曼德布罗特将词视为“讯息”,发送者在将信息量最大化的同时尽量将发送信息的成本最小化。例如,“feline”和“cat”的意思都是猫,但后者更短,因此传送成本也更低(或者更节省能量)。曼德布罗特证明,如果同时优化信息量和传送成本,就会导致齐普夫定律。
1701068226
1701068227 几乎同时,西蒙(Herbert Simon)也提出了一种解释  [283]  ,可以说是偏好附连的前身。西蒙设想一个人每次向文本中添加一个词。他认为,人们重用一个词的概率正比于这个词在文本中的当前频数。没出现过的词具有同样的非零概率。西蒙证明这个过程产生的文本会遵循齐普夫定律。
1701068228
1701068229 对于曼德布罗特和西蒙的解释哪个正确,争论很激烈  [284]  (从《信息与控制》杂志不断收到的信件可见一斑)。
1701068230
1701068231 结果,几乎与此同时,让所有人都大跌眼镜,心理学家乔治·米勒(George Miller)使用简单的概率论证明,  [285]  让猴子在键盘上随意敲击,如果(偶然)敲到了空格键就断词,这样得出的文本同样遵循齐普夫定律。
1701068232
1701068233 20世纪30—50年代针对齐普夫定律提出的许多解释是目前针对自然界中产生幂律的物理或信息机制的争论的缩影。理解幂律分布的根源、意义和在各学科中的共性,是目前许多复杂系统研究领域最为重要的未解决的问题。我相信,随着这些现象背后的科学越来越清晰,你还会不断听到这个问题的消息。
1701068234
1701068235 复杂 [:1701064835]
1701068236 第18章 进化,复杂化
1701068237
1701068238 在第1章我曾问过:“生物进化是如何产生出个体如此简单、整体上又如此复杂的生物呢?”通过书中的例子我们可以看到,对生命系统的理解越深入,就越感到惊讶,这样精巧的复杂性居然是通过有利突变和历史偶然的逐步积累形成的。这也正是从达尔文时代到现在神创论或其他超自然“智能设计”的拥护者论证的依据。
1701068239
[ 上一页 ]  [ :1.70106819e+09 ]  [ 下一页 ]