1700255561
每一次深裂叶的起源都伴随着基因调节的变化。植物在萌发的初期,只有尖部一小块组织内的细胞能够分裂,促进幼苗生长,推动植物向上穿破土壤。这块分裂组织也是一株植物所有的叶子最初起源的地方。在形成肉眼可见的幼叶之前,一小簇细胞,或者叫叶原基,就已经从其他分裂的细胞中分化出来,专门用以形成叶片。叶原基里的细胞都会表达一种名为KNOX的调节蛋白。
1700255562
1700255563
牛津大学的安杰拉·海(Angela Hay)和米托斯·茜提斯(Miltos Tsiantis)曾经用一种十分不起眼的草本植物——碎米荠(hairy bittercress)进行实验,通过控制植物体内KNOX蛋白的合成,他们才发现了这种蛋白质在叶片形成中扮演的重要角色。随着KNOX的合成量降低,碎米荠深裂叶的缺刻数量会逐渐减少直至变成单叶。而如果调高KNOX的合成,深裂叶的缺刻就会相应增加。不仅如此,他们还发现KNOX不仅在碎米荠中,还在许多其他种类的植物体内控制着深裂叶的形成。
1700255564
1700255565
1700255566
1700255567
1700255568
上面的那些例子,以及无数我们未提到的事实都反映了基因调节对于生物进化的重要性。无论是世界上各个实验室的研究记录本,还是各种学术刊物,都充斥着有关基因调节分子的研究,比如植物中的KNOX、蝴蝶体内的distalless以及果蝇的齿状蛋白等。人类的基因组编码了超过2 000种不同的调节因子,它们构成了数十个相对独立的调控环路。过去半个世纪的研究已经让我们窥见了基因调控在塑造生物形态中的重要性,它有助于我们理解许多新性状进化的过程,以及性状背后的基因表达代码。
1700255569
1700255570
但不论现实中的例子有多丰富,也不过只是告诉了我们蜥蜴的四肢和鱼的鳍在发育中与Hox基因家族有关而已,即不同的调节因子表达谱导致了不同的基因表达结果。即使我们找到了新性状与新调控环路之间的关联,也还是无法解释进化是如何找到这些最合适的基因表达的。(调控环路的种类越多,要弄清这些环路的起源就越困难。)另外,由于调控环路在进化过程中时刻积累着微小的变化,如何保持已有的优良基因表达谱就成了一个充满矛盾性的难题。仅有调控促进进化的例子,还是无法告诉我们这个过程到底是如何实现的。
1700255571
1700255572
你可能会觉得这个问题很眼熟,其实它的答案也不陌生:我们需要研究尽可能多的调控环路,最好是整个图书馆里的调控基因型和它们的表现型。调节因子图书馆里收录的是编码调节因子的DNA,以及它们识别的DNA关键词。但如果我们直接以这种方式记录所有的馆藏,整个过程将无比烦琐和冗长,就像你要用每一个分子的空间定位来描述一栋房子一样。其实你大可以用一张房子的图纸省下很多力气,就像图5-4中的示意图那样。
1700255573
1700255574
整个调节图书馆内包含了所有可能的调控通路,换句话说,就是包含了所有可能的图纸。你可能会觉得归档这些内容很困难,但实际上极其简单。调控环路里的任何一个调节因子,比如说A,如果我们要研究它与另一个调节因子B的关系,那么它的影响不过就是3种可能中的一种:A能够激活B、抑制B,或者根本对B没有影响。对于任何一对调节因子而言都是同样的道理,比如图5-4中的调节因子A和C,或者D和E,调节因子能够激活、抑制另一个调节因子,或者毫无作用。
1700255575
1700255576
对于所有调节因子来说都仅有3种可能性。这个基本的原则能够帮助我们更好地理解图5-4中的5个基因的调控环路,接下去要做的就是数清这5个基因之间有多少种配对方式。图5-4中的环路内有52种配对方式,对于每一对基因而言都有3种不同的可能效应。第一对基因有3种可能的效应,第二对、第三对也同理,以此类推,直到第25对。所以5个基因的调控环路的所有可能结果一共有325种,换句话说,由5个基因组成的调控环路有超过8 000亿种可能。
1700255577
1700255578
对于5个基因来说,8 000亿这个数字显得着实惊人,尤其是许多现实的调控环路中包含的基因数量远远不止5个。以脊椎动物的Hox基因家族为例,它们组成的调控环路里有至少40个基因。要计算40个基因的调控环路有多少种可能性,我们可以采用同样的方法:首先计算基因的配对数量,为402(1 600)种,然后计算31600。如此大的量级对于我们而言并不陌生,这个数值超过10700,如果把它印刷出来,那么可以铺满这整页纸。
1700255579
1700255580
但请不要忘记的是,虽然这个数字已经超乎常理的大了,但是它和环路数量的实际值相比依旧有差距。因为到目前为止,我们一直假定每个调节因子在调控环路里的作用是同等重要的,一个调节因子要么将目标基因激活,要么将其关闭。事实上,有的调节因子的作用相对较弱,有的则相对较强,作用强弱的差别使得情况大大复杂化了:每对基因面对的可能结果不再是3种,而是5种:没有作用、弱激活、强激活、弱抑制或强抑制。于是,我们计算的幂底数就从3变成了5。这还没有完。
1700255581
1700255582
如果我们有办法进一步区分基因激活或抑制的强弱程度,那么可能的调控环路数量还会继续增加。幸运的是,我所在实验室的研究表明,对于激活或者抑制程度的细分除了数量之外,并不会改变整个图书馆里的组织原则。这是个好消息,说明数量根本没有那么重要,因为光是以3作为幂底数,调控环路的数量就已经是超宇宙级别了,再多一些似乎也无妨。
1700255583
1700255584
基因调控环路图书馆和它收录的基因型馆藏与我们之前探讨过的代谢图书馆和蛋白质图书馆有诸多相似之处。当基因发生变异之后,我们以添加或是去掉基因之间的线条来表示两者调节关系上的改变。但是请记住,这些线条不是真实存在的,仅仅代表基因之间存在调节关系,而这种关系受到变异的影响。每当你改变其中一对基因的调节关系,你就得到了一个原环路的相邻环路。
1700255585
1700255586
图5-6中给出了一个例子,由于变异,与左侧的环路相比,右侧环路中的B基因不再调节D基因的表达(这种调节在左侧由那个粗箭头表示)。每个调控环路都有许多相邻环路,如果是40个基因的调控环路,每种环路的相邻环路将达到3 000多个。如果我们把所有的调控通路安置在一个超立方体上,每个顶点对应一个环路,再故伎重演,那么寻找相邻环路的过程相当于沿着超立方体的边从一个顶点移动到下一个顶点。由于超立方体存在于多维空间,所以从每一个顶点出发的边有许多条,与40个基因对应的超立方体存在于1 600维空间。这个超立方体的顶点数量远远不止1 600个,而是达到了10700个,这也是图书馆中所有包含40个基因的调控环路的馆藏数量。
1700255587
1700255588
1700255589
1700255590
1700255591
图5-6 调节环路图书馆中的相邻环路
1700255592
1700255593
和我们前面介绍过的其他两座图书馆一样,超立方体上的每一个环路都有各自的“社区”,里面包含所有与之在图书馆里相邻的馆藏,也就是仅相差一对或少数几对的调控环路。微小的基因改变,哪怕只是一个DNA分子的变异,就有可能建立或是摧毁一对基因之间已有的作用,进化只要抬脚走上没几步,就能从一个书架走到下一个书架并浏览上面的文本。循着相邻基因一直往前,你就会逐渐深入到图书馆内——这样的旅程你已经不陌生了。而在这里,距离的概念变成了两个环路之间连线的差别。越是临近的环路之间差距越小,而相距甚远的环路之间则几乎没有相同的连线,分别位于图书馆中截然相反的两个方向。
1700255594
1700255595
同样的道理,图书馆里的多数环路基因型是随机的,没有任何意义。但也有一些编码了有意义的单词或句子,只是整体而言依旧词不达意、不知所云,甚至会宣扬恶俗言论,比如变异的Hox基因最终将导致没有手掌的残疾手臂。我们这里所说的文字和语言,同样是指基因调节和表达的化学语言,只有细胞和组织真正理解它们,并最终将它们翻译成脊椎骨、叶子或手掌等血肉的语言。而新性状的诞生过程我们在单叶进化为深裂叶中已经多少介绍过了。
1700255596
1700255597
我们在前面已经探讨了调控环路通过操纵基因表达控制性状的原理。从一套预先存在的调节因子开始,比如果蝇在受精卵内留下的分子信号,后续的调节因子逐渐形成调控环路,并改变最初的基因表达模式。基因在发育过程中开开闭闭,直到抵达某个平衡点,然后就犹如马戏团里的杂技演员们,保持巍然不动。对于马戏团里表演叠罗汉的杂技演员们来说,他们的平衡建立在相互牵制的基础上,这一处的推力在那边相当于拉力,而打破这种平衡状态唯一的办法则是瓦解其中的某个个体。
1700255598
1700255599
通过多年的研究,我们对于这种平衡的理解已经足够我们演算平衡点了,就像约翰·瑞尼茨的果蝇模拟器。我们已经能够同时考量的环路数目不是一个或几个,而是数百万个,这相当于同时演算整个超宇宙级别的图书馆。
1700255600
1700255601
我们从一开始就知道环路图书馆里的馆藏数量超出任何人的想象,哪怕是环路的表达谱数量也不是闹着玩的。如果在一个含有40个基因的环路中,每一个基因只有激活或关闭两种可能,那么40个基因就有240种可能表现型,总值超过一万亿。而现实中一个基因的状态并不是非白即黑的,它可以微弱、中等、强烈或是非常强烈地进行表达。不仅如此,生物形态的造就往往需要多个不同的调控环路协同合作,这也大大增加了表达谱的可能数量。与所有这些表达谱的数量相比,我们体内区区数百种不同的细胞和组织几乎不值一提。如果我们把体内所有的细胞都铺陈出来,让每一个细胞对应基因表达谱中的一种,那么最终将无法容下所有的表达模式。
1700255602
1700255603
进化用我们熟悉的随机游走方式探索着调控环路的图书馆,生物种群的形态重塑来自偶然的DNA复制错误,这些错误的复制一般发生在亲本将遗传物质传递给后代的时候。微小的突变通常会导致两种可能的结果,即改变调节因子的形态并阻止它们与DNA结合,或者直接改变DNA上调节因子可识别的“关键词”——这种改变会阻碍正常的调节因子识别对应的基因,抑制基因表达,同时也有可能令DNA被新的调节因子识别。
1700255604
1700255605
上述的第一种结果往往会造成灾难性的后果,因为一种调节因子通常可以作用于许多种不同的基因。如果调节因子失去识别DNA的能力,相当于把一份食谱里的原料混淆一气,最后做出的料理可想而知,这会导致生物体的严重畸形,甚至胚胎在出生前就会夭折。而第二种结果则更像是食谱里的某个印刷错误,往往只涉及某个基因的表达以及相应的蛋白质数量——它只不过是数千种蛋白质中的一种而已,这使它导致严重后果的可能性变得很小。有人可能会想,生物体对第二种变化的容忍度要更高,因此也更容易在进化的时间跨度上稳定地积累下来。如果当真如此,这些积累的微小变化就能够逐步改变环路里的调控模式。
1700255606
1700255607
如果把在过去数百万年中独立进行进化的调控通路拿来比较的话,比如数千种不同的果蝇体内的某几个调控环路,我们就会发现,生物体耐受性最好的变化发生在环路内的基因之间的相互作用中,而不是基因本身。进化的改变总是从某一对基因之间的作用着手,因为直接对基因下手容易造成严重的后果。此外,基因对之间作用的微小影响的确会积累并逐渐改变调控环路,而这个过程十分漫长。改变缓慢的原因在于调节因子的DNA关键词通常只有5个碱基对的长度,且与下游基因有着数千个碱基对的距离。如果仅凭概率,那么随机突变产生新关键词并由此将两个基因联系在一起的可能性要更大一些。
1700255608
1700255609
1700255610
[
上一页 ]
[ :1.700255561e+09 ]
[
下一页 ]