打字猴:1.70106833e+09
1701068330
1701068331
1701068332 ▲图18.2 考夫曼(Daryl Black摄影,经许可重印)
1701068333
1701068334 考夫曼是复杂系统的传奇人物。我第一次遇见他是在我读研究生最后一年参加的一次会议上。他的演讲被安排在会议的最开头,我必须说,当时对我来说,那是我听过的最富启发的演讲。我不记得主题具体是什么;我只记得当时听演讲的感觉,我感到他讲得非常深刻,他提出的问题极为重要,我想去和这家伙一起做研究。
1701068335
1701068336 考夫曼刚开始是研究物理学,但很快就转向了遗传学研究。他的研究新颖而且极具影响,为他赢得了许多学术荣誉,包括麦克阿瑟“天才”奖,以及圣塔菲研究所的职位。在SFI的研讨会上,考夫曼经常会在听众席上插话:“我知道我只是个孤陋寡闻的乡下博士,但……”然后针对他以前不知道的一些很专业的主题滔滔不绝地讲述他即兴的想法,他可以讲上5分钟或更长时间。一位科学记者称他为“世界级的知识即兴演奏家”  [301]  ,这个评价我认为相当中肯。
1701068337
1701068338 考夫曼说自己是“孤陋寡闻的乡下博士”只是谦虚。他是最有影响力的复杂系统思想家之一,富有远见,绝不是什么孤陋寡闻的人物。SFI有个笑话,说考夫曼“拥有达尔文进化论的专利”。事实上,他确实拥有在实验室演化蛋白质序列的专利技术,这项技术可以用来发现新的药物。
1701068339
1701068340 随机布尔网络
1701068341
1701068342 考夫曼可能是第一个发明和研究基因调控网络的简化计算机模型的人。他的模型结构是所谓的随机布尔网络(Random Boolean Network, RBN),是从元胞自动机扩展而来。同其他网络一样,RBN也包含节点以及节点之间的边。类似于元胞自动机,RBN以离散时间步的形式更新节点状态。在每一步各节点可以处于开状态或关状态。
1701068343
1701068344 状态只有开和关两种,这也是布尔一词的由来:布尔规则(或函数)的输入是一些等于0或1的数,根据输入得到的输出也要么是0要么是1。这类规则因数学家布尔而得名,布尔对其进行了深入的研究。
1701068345
1701068346 在RBN中,边是有方向的:节点A有边指向节点B,节点B并不必然(但可能)有边指向节点A。各节点的入度(从其他节点指向这个节点的边的数量)都是一样的,记为数字K。
1701068347
1701068348 下面来看看如何构建一个RBN:对每个节点,随机选取K个节点(可能包括自己),建立从这些节点指向目标节点的边,然后给这个节点随机赋予一条布尔规则,规则的输入为K个开关状态,输出则为单个开关状态[图18.3(a)]。
1701068349
1701068350
1701068351
1701068352
1701068353 ▲图18.3 (a)5个节点组成的随机布尔网络。各节点的入度(K)等于2。在第0个时间步,各节点处于随机的初始状态:开(黑)或关(白)。(b)各节点更新状态后第1个时间步的网络
1701068354
1701068355 RBN运行前,给每个节点赋予随机选择的初始开关状态。在每个时间步,各节点将自己的状态传送到其连接的节点,并从连接到它的节点接收状态输入。然后各节点根据其规则和输入确定自己下一步的状态。图18.3显示了一个5节点的RBN在第1步的变化,每个节点有2个输入。
1701068356
1701068357 RBN类似于元胞自动机,但是有两个主要区别:节点不是与空间上相邻的节点相连,而是随机连接,另外元胞自动机各节点的规则是一样的,而RBN的每个节点都有自己的规则。在考夫曼的研究中,RBN被作为基因调控网络的理想模型,其中节点代表“基因”,节点A指向节点B的边则表示“基因A调控基因B”。这个模型显然比真正的基因网络要简单得多。现在在生物学中使用这种理想模型已经很普遍,但在20世纪60年代考夫曼开始研究时还很少有人接受。
1701068358
1701068359 混沌边缘的生命
1701068360
1701068361 考夫曼和他的学生及同事用各种入度值K进行了大量RBN实验,从随机初始状态开始,然后迭代许多步,节点状态一开始会以类似随机的方式变化,但最终要么停在不动点上(所有节点状态保持不变),要么进入周期振荡(整个网络的状态以较短的周期振荡),要么就根本不停下来,迭代了很久仍然像是随机变化。这种变化实际上是混沌,因为网络状态变化的轨迹敏感依赖于网络的初始状态。
1701068362
1701068363 考夫曼发现最终的行为是由网络中的节点数量以及各节点的入度K决定的。随着K从1开始(各节点只有一个输入)逐渐增大到等于全部节点的数量(每个节点都从其他所有节点有输入,包括它自己),RBN的典型行为经历了3种类型(不动点、振荡、混沌)。你可能注意到了这与逻辑斯蒂映射随着R增大时的行为变化类似(参见第2章)。在K=2时考夫曼发现了一个有趣的类型——既不是不动点、振荡,也不是完全混沌。类似于逻辑斯蒂映射的“混沌的发端”,他称之为“混沌边缘”。
1701068364
1701068365 考夫曼认为RBN能反映真实的基因网络的行为,他用水在各种温度下的状态作类比:“控制从受精卵到成人的发育的基因组网络  [302]  有可能处于以下三种类型:类似冰冻的有序态,类似气体的混沌态,以及位于有序和混沌之间类似液态的区域。”
1701068366
1701068367 考夫曼认为,生物既要具有活性同时又要稳定,RBN所模拟的基因网络应当为“液态”才有意义——既不能太僵硬也不能太混沌。用他的话说:“生命存在于混沌的边缘。”  [303]  
1701068368
1701068369 考夫曼用动力系统理论的术语——吸引子、分叉、混沌——来阐述他的发现。将节点可能的状态组合称为网络的全局状态。由于RBN的节点数量有限,因此可能的全局状态的数量也是有限的。如果网络迭代足够长时间,就必然会重复之前出现过的全局状态,接下来就会循环。考夫曼将这种循环称为网络的“吸引子”。通过反复实验,他估计出K=2时产生的不同吸引子的平均数量大致等于节点数量的平方根。
1701068370
1701068371 然后考夫曼对模型进行了大胆的解读。身体中所有细胞都具有同样的DNA。然而,细胞的类型却有很多:皮肤细胞、肝细胞,等等。考夫曼认为确定具体细胞类型的就是细胞中的基因表达形式——前面我曾讲过不同细胞的基因表达形式可以差别很大。在RBN模型中,一种吸引子就对应一种“基因表达”形式。因此考夫曼提出他的网络中的吸引子就对应于生物体内的一种细胞类型,细胞类型的数量应当接近100000的平方根,大约316种。这与在人类身上发现的细胞种类数量——约为256种——相差不大。
1701068372
1701068373 在考夫曼进行这些计算的时候,普遍认为人类基因组包含大约100000个基因(因为人体中大约有100000种蛋白质)。考夫曼很兴奋,他的模型很好地预测了人体中细胞种类的数量。现在我们知道人类基因组只有25000个基因,因此根据考夫曼的模型得出的预测是大约158种。
1701068374
1701068375 有序的起源
1701068376
1701068377 模型并不完美,但考夫曼相信它揭示了他对生命系统最重要的一般性观点:原则上自然选择对于复杂生物的产生并不是必需的。许多K=2的RBN也能表现出“复杂”行为,而其中并不涉及自然选择或进化算法。他的观点是,一旦网络结构变得足够复杂——即有大量节点控制其他节点——复杂和“自组织”行为就会涌现出来。他说:
1701068378
1701068379 继承了达尔文传统的大部分生物学家都认为1,个体发育的有序性有赖于某种分子级的鲁布·戈德堡机器慢慢打磨2,这种机器是通过进化一点一滴累积而成的。我的观点相反:个体发育过程中的美丽秩序大部分是自发的,是极度复杂的调控网络所包含的惊人自组织的自然表达。我们似乎从根本上就错了。秩序,无处不在而且有生命力的秩序,是自然发生的。
[ 上一页 ]  [ :1.70106833e+09 ]  [ 下一页 ]