1700255590
1700255591
图5-6 调节环路图书馆中的相邻环路
1700255592
1700255593
和我们前面介绍过的其他两座图书馆一样,超立方体上的每一个环路都有各自的“社区”,里面包含所有与之在图书馆里相邻的馆藏,也就是仅相差一对或少数几对的调控环路。微小的基因改变,哪怕只是一个DNA分子的变异,就有可能建立或是摧毁一对基因之间已有的作用,进化只要抬脚走上没几步,就能从一个书架走到下一个书架并浏览上面的文本。循着相邻基因一直往前,你就会逐渐深入到图书馆内——这样的旅程你已经不陌生了。而在这里,距离的概念变成了两个环路之间连线的差别。越是临近的环路之间差距越小,而相距甚远的环路之间则几乎没有相同的连线,分别位于图书馆中截然相反的两个方向。
1700255594
1700255595
同样的道理,图书馆里的多数环路基因型是随机的,没有任何意义。但也有一些编码了有意义的单词或句子,只是整体而言依旧词不达意、不知所云,甚至会宣扬恶俗言论,比如变异的Hox基因最终将导致没有手掌的残疾手臂。我们这里所说的文字和语言,同样是指基因调节和表达的化学语言,只有细胞和组织真正理解它们,并最终将它们翻译成脊椎骨、叶子或手掌等血肉的语言。而新性状的诞生过程我们在单叶进化为深裂叶中已经多少介绍过了。
1700255596
1700255597
我们在前面已经探讨了调控环路通过操纵基因表达控制性状的原理。从一套预先存在的调节因子开始,比如果蝇在受精卵内留下的分子信号,后续的调节因子逐渐形成调控环路,并改变最初的基因表达模式。基因在发育过程中开开闭闭,直到抵达某个平衡点,然后就犹如马戏团里的杂技演员们,保持巍然不动。对于马戏团里表演叠罗汉的杂技演员们来说,他们的平衡建立在相互牵制的基础上,这一处的推力在那边相当于拉力,而打破这种平衡状态唯一的办法则是瓦解其中的某个个体。
1700255598
1700255599
通过多年的研究,我们对于这种平衡的理解已经足够我们演算平衡点了,就像约翰·瑞尼茨的果蝇模拟器。我们已经能够同时考量的环路数目不是一个或几个,而是数百万个,这相当于同时演算整个超宇宙级别的图书馆。
1700255600
1700255601
我们从一开始就知道环路图书馆里的馆藏数量超出任何人的想象,哪怕是环路的表达谱数量也不是闹着玩的。如果在一个含有40个基因的环路中,每一个基因只有激活或关闭两种可能,那么40个基因就有240种可能表现型,总值超过一万亿。而现实中一个基因的状态并不是非白即黑的,它可以微弱、中等、强烈或是非常强烈地进行表达。不仅如此,生物形态的造就往往需要多个不同的调控环路协同合作,这也大大增加了表达谱的可能数量。与所有这些表达谱的数量相比,我们体内区区数百种不同的细胞和组织几乎不值一提。如果我们把体内所有的细胞都铺陈出来,让每一个细胞对应基因表达谱中的一种,那么最终将无法容下所有的表达模式。
1700255602
1700255603
进化用我们熟悉的随机游走方式探索着调控环路的图书馆,生物种群的形态重塑来自偶然的DNA复制错误,这些错误的复制一般发生在亲本将遗传物质传递给后代的时候。微小的突变通常会导致两种可能的结果,即改变调节因子的形态并阻止它们与DNA结合,或者直接改变DNA上调节因子可识别的“关键词”——这种改变会阻碍正常的调节因子识别对应的基因,抑制基因表达,同时也有可能令DNA被新的调节因子识别。
1700255604
1700255605
上述的第一种结果往往会造成灾难性的后果,因为一种调节因子通常可以作用于许多种不同的基因。如果调节因子失去识别DNA的能力,相当于把一份食谱里的原料混淆一气,最后做出的料理可想而知,这会导致生物体的严重畸形,甚至胚胎在出生前就会夭折。而第二种结果则更像是食谱里的某个印刷错误,往往只涉及某个基因的表达以及相应的蛋白质数量——它只不过是数千种蛋白质中的一种而已,这使它导致严重后果的可能性变得很小。有人可能会想,生物体对第二种变化的容忍度要更高,因此也更容易在进化的时间跨度上稳定地积累下来。如果当真如此,这些积累的微小变化就能够逐步改变环路里的调控模式。
1700255606
1700255607
如果把在过去数百万年中独立进行进化的调控通路拿来比较的话,比如数千种不同的果蝇体内的某几个调控环路,我们就会发现,生物体耐受性最好的变化发生在环路内的基因之间的相互作用中,而不是基因本身。进化的改变总是从某一对基因之间的作用着手,因为直接对基因下手容易造成严重的后果。此外,基因对之间作用的微小影响的确会积累并逐渐改变调控环路,而这个过程十分漫长。改变缓慢的原因在于调节因子的DNA关键词通常只有5个碱基对的长度,且与下游基因有着数千个碱基对的距离。如果仅凭概率,那么随机突变产生新关键词并由此将两个基因联系在一起的可能性要更大一些。
1700255608
1700255609
1700255610
1700255611
1700255612
如果调节环路图书馆中的10700件馆藏里只有一个表达谱与Hox家族吻合,那么它就如同一根掉进宇宙的绣花针,生物进化大可以早早放弃挣扎。我在20世纪90年代就疑惑过,为何进化最终还是战胜这渺茫的概率找到了Hox家族,不过我并没有把这个问题太当回事,当时的我正为别的研究项目忙得焦头烂额。直到2004年,当我在靠近法国巴黎的高等科学研究所进修休假[17]时,才开始认真考虑这个问题。
1700255613
1700255614
高等科学研究所坐落在一个到处是参天古树的田园乡间,那里有着精心修剪的灌木、争相怒放的花朵,还有在思考问题时能够信步的幽静小道,简直是对那些受尽经费申请、社交应酬以及社区活动纷扰的生物学家来说最好的避难所。常驻在研究所内的几个为数不多的科学家都是非同凡响的优秀学者,他们当中有数名菲尔兹奖的获得者(菲尔兹奖是公认的数学领域的诺贝尔奖)。
1700255615
1700255616
研究所主要的研究领域是数学和物理学,但所内的首席科学家们早就注意到了分子生物领域长期以来的停滞不前,他们预见到当前盲人摸象般的研究方式需要一种整体水平的学科进行整合,而这种洞见的产物就是一门分支学科:系统生物学(systems biology)。这个新近出现的研究领域把实验数据和数学、计算机技术结合起来,试图解释分子水平的活动如何作用于生物整体,换句话说,就是微观分子如何构成了宏观生物体。数学家和物理学家手握许多解决这种问题的理论手段,所以研究所邀请了像我这样的生物学家造访,想要看看不同领域的科学家能否联手合作。
1700255617
1700255618
我很庆幸当初接受了这份邀请,因为正是在巴黎,我遇见了奥利弗·马丁(Olivier Martin)。
1700255619
1700255620
奥利弗是一名享有国际声誉的统计物理学教授,任职于巴黎市郊的奥赛大学(University of Orsay)。像奥利弗这样的统计物理学家,很擅长解决海量微观粒子的宏观现象,比如高压密封罐里的丙烷气体是如何在宏观上产生压力的。对类似压力现象的把控非常重要,谁都不会愿意看到储气罐爆炸,但想要实现也并不容易,因为气体分子和储气罐内壁每时每刻都在发生万亿次的碰撞。统计物理学家乐于把数以万亿计的微观分子看作一个整体,因为单独考量每个个体分子几乎是不可能的,所以他们发明了一套用于研究类似体系的统计方式,算法中包含了复杂的统计学手段。不过我们这里所说的统计分析除了名字之外,与美国大选中民调专家口中所谓的统计分析没有任何关系。
1700255621
1700255622
奥利弗也有自己的烦恼。今天的统计物理学就像一家被饿汉们席卷之后的自助餐厅:大多数主要的问题基本都已经被解决了,剩下的都是残羹冷炙,剩下的问题不是太艰涩就是太微不足道,这样的情况从19世纪詹姆斯·克拉克·麦克斯韦(James Clerk Maxwell)和路德维希·玻尔兹曼(Ludwig Boltzmann)用统计学开创热力学以来就没有发生过太大的改变。和他所在领域里的众多其他科学家一样,奥利弗非常渴望突破物理学的局限。他的烦恼在于不知道如何在系统生物学领域找到一个难度合适的新问题,让他所掌握的统计物理学技能找到用武之地。
1700255623
1700255624
而我却有一座馆藏数量达到10700件的图书馆要照看。乖乖,我就是奥利弗的贵人啊!
1700255625
1700255626
奥利弗·马丁和我开始合作之后没多久,我就对他感激不尽。他作为科学家的直觉和学术素是为我们探索图书馆最好的保障。不过他可不仅仅是一位旅途中的好伙伴,更是一位亲切慷慨的师长,不时耐心地提点我们,用他掌握的专业技能帮我们摆脱眼前的困境。
1700255627
1700255628
我们研究开始的第一步是为了解决一个问题,而这个问题你已经非常熟悉了:某种含义的文本在调控环路图书馆里是不是唯一的?为了找出答案,我们从图书馆里的某个环路开始,模拟和计算这个环路的表达结果。然后我们改变其中一对基因的作用关系,查看这个变异能否改变表现型,接着再恢复到最初的环路,改变第二对基因,依次类推,直到我们检验完所有的相邻环路并得到它们的表现型。为了排除某个调控环路的偶然性,我们选择了许多不同的环路作为起点进行上述的检索,这些环路包含了不同的基因数量、不同的相互作用基因对、不同的基因相互作用以及不同的表现型。
1700255629
1700255630
最终,我们得到的结论是一致的。每个调控环路所处的社区里往往包含数十个到数百个表现型相同的相邻环路。也就是说,即使发生基因突变,单个基因对作用关系的改变也不一定会引起调控环路表现型的改变。基因调控环路不像马戏团里杂技演员表演的叠罗汉,不是其中一个个体“差之毫厘”,整体就会“失之千里”。调控环路的基因型之所以能够耐受这样的突变,是由于并非每一对基因间的关系都对环路的功能有重要贡献。
1700255631
1700255632
从一个环路出发的第一步我们就已经得到了一个重要的结论:没有哪种性状,不管是果蝇的体节、植物的深裂叶还是脊椎动物的脊柱,都是由独一无二的调控环路塑造的。基因对关系不同的调控环路同样能够产生相同的性状。不过我们不知道这些表现型相同的环路到底有多少,在超过40个基因的调控环路里筛查所有环路的计算量是我们力所不及的。哪怕是规模小得多的环路,计算量也非同小可:10个基因的调控环路有超过1040种可能性,而20个基因的环路则有10160种。实现同一个性状的基因型远远不止一个。
1700255633
1700255634
接下来,为了评估同一表现型的不同基因型在图书馆里的相对距离,我们再一次借助探索代谢图书馆和蛋白质图书馆时用过的随机游走。选择一个起点,模拟环路的表现型,而后改变某一对基因的作用,即添加或者抹掉一个基因对另一个基因的作用,以此移动到相邻的调控环路上,在保证表现型不变的情况下,继续重复上述步骤,直到无法通过改变任何单个基因对维持表现型稳定。
1700255635
1700255636
不出所料,我们又能凭借这种方式横穿几乎整个图书馆。基因对差异超过90%的两个调控环路依旧能够产生相同的表现型。如果用示意图标记两个环路里的基因联系,你可能永远想不到两者是如何经过一步一步微小的变化而成为对方的。但它们的确指向了某个问题的答案:如何产生某种特定的蛋白质指导细胞特定的分化。
1700255637
1700255638
为了确保结果具有代表性,包括我们模拟的表现型,我们尝试了以各种不同的环路作为起点,不同的环路基因数量、不同的基因间关系数量、不同的作用关系以及不同的基因表现型,而这些对结论都没有影响。某些环路虽然差异巨大,但是表现型却相同,最小的差异只有“区区”75%而已。但是“如此小”的差异依旧很难让人联想到它们之间居然还存在着联系。
1700255639
[
上一页 ]
[ :1.70025559e+09 ]
[
下一页 ]