1700001208
1700001209
快速演化在理论上可行,并不等于它真的就发生了。然而,“自然讨厌真空”,我们有充分的理由相信,真核生物的演化很可能是迅速发生的。问题在于,真核生物共有一系列特征,而原核生物什么都没有。这暗示了某种不稳定性。我们在第一章中讨论过源真核生物,它们是相对简单的单细胞真核生物,过去一度被误认为是介于原核生物和真核生物之间的演化中间型。后来才发现,这些异类其实都是更复杂的真核生物后代,其祖先拥有全套的真核生物特征。无论如何,源真核生物仍然是真正的生态中间型:它们占据了介于原核生物与真核生物之间、形态复杂度中等的生态位。它们填充了这个空白。所以乍一看,已经没有空白了,生物的形态复杂度由简及繁,呈现连续不断的分布,从最简单的基因寄生物到大型病毒、细菌、简单真核生物、复杂真核细胞,直到多细胞生物,一切都稳妥完美。然而最近的研究发现,源真核生物其实名不符实,演化生物学中令人恐慌的巨大空白才浮现在我们面前。
1700001210
1700001211
源真核生物并未在竞争中灭绝,这证明简单的“中间型”生物很适应它们的生存空间。所以,没有理由认为,真正的演化中间型不能占据相同的生态位,比如没有线粒体、没有细胞核、没有过氧化物酶体的细胞,或者没有高尔基体和内质网等内膜系统的中间型细胞。如果真核生物演化得很慢,需要几千万甚至几亿年的时间,那就应该出现很多稳定的、缺少某些真核生物特征的中间型细胞,它们就应该占据今天源真核生物的中间生态位。其中至少有一部分,作为填充空白生态位的真正中间种,就应该能存活至今。然而一个都没有!科学界苦苦寻找许久,却从来没找到过。如果它们不是被竞争灭绝了,那为什么没有一个幸存者呢?我认为,原因在于它们的基因太不稳定。要跨越原核生物与真核生物之间艰险的鸿沟,基因组合上可行的路径并不多,大部分探索者都中途而亡。
1700001212
1700001213
这意味着最初的种群应该很小,这么推论也很合理。庞大的种群意味着演化上的成功。如果早期真核生物一下子就取得了演化成功,那么它们应该子孙繁盛,占据新的生态位,进一步分化。它们的基因应该很稳定,至少其中一部分应该可以存活至今。但这些并未发生。现在看来,最初的真核生物基因都不稳定,它们在一个很小的种群内快速演化,挣扎求生。
1700001214
1700001215
还有另一个原因让我们相信事实正是如此:所有的真核生物都拥有众多完全相同的特征。仔细想想这有多奇怪!所有人类都有一样的特征,比如直立的姿势、无毛的身体、拇指对握、大容量的脑、发达的语言能力,因为人类都源自同一群互相交配的祖先。还有性。一群可以互相交配生殖的生物个体,就是对“物种”最简单的定义。种群内的生物如果无法互相交配产生可育后代(即生殖隔离),就会分道扬镳,各自演化出不同的特征,最终变成不同的新物种。然而在真核生物诞生之初,生殖隔离似乎并未发生,因为所有的真核生物都有一样的基本特征,很像是一个可以互相交配生殖的种群。有性生殖。
1700001216
1700001217
还有任何其他的生殖方式可以达成这样的结果吗?我认为没有。无性生殖(即“克隆”)会导致深远的发散演化,因为不同种群内的不同突变都会累积下来。这些突变在不同的环境中接受自然选择,面对的优势和劣势也迥然各异。克隆虽然可以制造出完全相同的个体,但反而会因此在不同种群中累积不同的突变,致使它们分化。有性生殖则形成鲜明的对比。有性生殖在种群内部形成基因池,不断地混合匹配各种特征,从而阻止分化。所有真核生物都具有一样的基本特征,这表明它们起源于一个互相交配、进行有性生殖的种群。这又意味着它们的种群不会太大,才能在严格意义上互相交配,形成单一基因池。种群中的任何细胞只要不能进行有性生殖,就无法留下后代。《圣经》又一次言中:“引到永生,那门是窄的,路是小的,找着的人也少。”
1700001218
1700001219
那么,在细菌和古菌中十分普遍的基因分享方式——水平基因转移,可能造成这样的结果吗?与有性生殖一样,水平基因转移也涉及基因重组,也会变换不同的基因组合,造成“流动”的染色体。但是它与有性生殖的不同之处在于,水平基因转移并不是对等交换基因,也没有细胞融合或全基因组的系统性重组。水平基因转移是零敲碎打,而且是单向的,它无法对种群中的个体特征进行各种组合,反而会造成个体之间的分化。以大肠杆菌为例,单个细胞大约有4,000个基因,但大肠杆菌的宏基因组(所有菌株的基因总和。不同的大肠杆菌菌株以核糖体RNA的差异程度来划分)差不多有18,000个基因。水平基因转移盛行的结果,是同一种细菌的不同菌株之间可能有多达一半的基因都不一样,比所有脊椎动物之间的基因差异程度还要大。简而言之,原先细菌与古菌的主要遗传模式,无论是克隆还是水平基因转移,都无法解释真核生物神秘的一致性。
1700001220
1700001221
如果我在十年前撰写本书,那不会找到多少证据来支持有性生殖出现在真核生物演化早期的观点。那时候,不少真核物种都被认为是无性生殖的,包括多种阿米巴原虫和被误认为早期演化分支的源真核生物(例如梨形鞭毛虫)。甚至直到今天,还没有研究者能把梨形鞭毛虫捉奸在床,发现它们确实在进行微生物性交。不过,我们在对这些物种生活史了解不足的情况下,常常可以通过技术手段来弥补。我们已经测定了梨形鞭毛虫的基因组序列,其中有减数分裂(即形成配子的细胞分裂)所需的基因,而且这些基因完全处于可用状态。还有它们基因组的结构,也明显经历过规律的有性生殖基因重组。几乎每一种我们研究过的真核物种,或多或少都有类似的现象。也有例外,比如有些后来才演化出无性生殖的真核生物,但它们通常很快就灭绝了。所有已知的真核生物都进行有性生殖。因此我们可以认为,它们的共同祖先也进行有性生殖。总而言之,有性生殖出现在真核生物非常早期的演化阶段,而且只有假定有性生殖是在一个小且不稳定的始祖种群中演化而来,才能解释为什么所有的真核生物都有这么多共同特点。
1700001222
1700001223
至此,我们就要面对本章的中心问题:两个原核生物之间的内共生作用是否有某种特殊效应,推动了有性生殖的演化?当然是的。除此之外,还带来了许多重要的后果。
1700001224
1700001225
基因结构的秘密
1700001226
1700001227
真核生物有着“破碎的基因”。纵观20世纪的生物学研究,很少有比这更让人大吃一惊的发现。我们一度被早期的细菌基因研究误导,认为人类染色体上的基因也应该像漂亮的珠串一般,按照有意义的顺序排列。而实际发现的情况,就像遗传学家戴维·潘尼(David Penny)形容的那样:“如果有一个委员会设计了大肠杆菌的基因组,我会很荣幸参与其中。然而如果有一个人类基因组设计委员会,我绝对不会承认跟我有关。即使是那些低能的大学委员会,都不至于把工作做得这么糟。”
1700001228
1700001229
到底是什么这样糟糕呢?真核生物的基因是一个烂摊子。它们由好几个较短的序列组成,每一段编码蛋白质的一部分;这些编码区域之间插入了长长的非编码DNA序列,我们称之为内含子(introns)。每个基因中通常都插入了好几段内含子(基因通常的定义是,编码一整个蛋白质的DNA序列)。内含子的长短差异非常大,但通常都比真正的编码序列长得多。内含子也会被转录到RNA上。RNA是用来指定蛋白质氨基酸序列的模板,会被转运到核糖体;而核糖体是细胞质中的蛋白质制造工厂,会根据RNA模板(RNA transcript,又名RNA转录本)的序列把游离的氨基酸组装成蛋白质。不过在抵达核糖体之前,RNA上的内含子就已经被全部剪切掉。这可不是一项容易的工作,要靠另一种精巧的纳米蛋白小机器——剪接体(spliceosome)来执行。我们稍后再来讨论剪接体的重要意义。现在你只需要注意,这一整套执行程序是多么奇怪迂回。如果在剪切内含子的过程中稍有失误,一连串毫无意义的RNA转录本就会送到核糖体,随即会制造出一大堆毫无意义的蛋白质。核糖体就像卡夫卡小说中的官僚③,一丝不差地执行着它们的官僚程序,从不多想。
1700001230
1700001231
为什么真核生物有如此破碎的基因?有几个已知的好处。同一个基因可以通过不同的剪接方式拼出不同的蛋白质。例如,免疫系统就可以通过这样的蛋白质重组机制,把不同的蛋白质片段拼接成数十亿种不同的抗体。对于任何细菌或病毒,这样丰富的抗体中总有一款能选择性地黏附上去,形成免疫标记,启动免疫系统中的杀手机器去消灭它们。然而,免疫系统是大型复杂动物后期才发展出来的产物。在演化早期,破碎的基因有什么好处吗?福特·杜利特尔(Ford Doolittle)是20世纪的演化生物学老前辈,他曾在70年代提出一个假说,认为内含子可能出现于生命起源之初。这就是所谓的“内含子早现理论”(introns early)。他认为,早期的基因因为缺少现代基因复杂的修复机制,在复制过程中一定会迅速累积许多错误,这让它们非常容易遭受突变熔毁(mutational meltdown)。因为突变概率很高,DNA的长度会决定DNA上累积的突变数量,所以只有很短的基因组才可能避开突变熔毁的命运。如果只能有很短的DNA,那又如何大量制造各种各样的蛋白质呢?内含子就是解决方案,只需要重新组合许多小片段即可。这个理论非常精彩,至今仍有少数拥趸,不过杜利特尔本人已经倒戈。像所有优质的假说一样,这个假说也提出了一些预测。不幸的是,这些假说都被验证是错的。
1700001232
1700001233
这个假说给出的最重要一项预测,就是“真核生物最先演化出现”,因为只有真核生物才有真正的内含子。如果内含子真的是原始特征,那么真核细胞必定是最早出现的细胞,早于细菌和古菌。原核生物则是后来在自然选择的压力下,为了精简基因组而丢弃了内含子。从种系发生学的证据来看,这毫无道理。当代的全基因组测序无可争辩地显示,真核生物起源于古菌宿主和细菌内共生体。生命树上最早的分支在细菌和古菌之间,真核生物在更晚期才出现。化石证据和上一章讨论的生物能量学分析也支持这些结论。
1700001234
1700001235
然而,如果内含子不是原始特征,那么它们从何而来,又为什么会出现呢?答案看来是内共生体。我刚才说,细菌没有“真正的内含子”,但内含子的前身必定来自细菌,更准确地说,来自细菌的基因寄生物(bacterial genetic parasites),正式名称是移动II型自剪接内含子(mobile group II self-splicing introns)。不要管这些艰涩的术语,它们其实就是一种自私DNA,一种跳跃基因(jumping genes),在基因组中不断自我复制、跳进跳出。或许我把它们说得太简单了,它们其实是相当厉害、目的明确的小机器。它们也会由正常的转录机制转录成RNA,但之后马上就会“活过来”(没法否认它们是“活物”),把自己组装成RNA“剪刀”。这把剪刀会把基因寄生物从长长的RNA转录本中剪切出来,尽量减少对宿主细胞的伤害。剪下来的片段会形成活跃的复合体,编码一种逆转录酶(reverse transcriptase)。这种酶可以把RNA反向转录成DNA,并将其插回宿主的基因组。所以,移动内含子是一种基因寄生物,在细菌的基因组中不断切进切出。
1700001236
1700001237
“大跳蚤背上咬着小跳蚤……”谁能想到生物的基因组原来就像蛇鼠之窝,精明的寄生虫在里面大行其道,随心所欲进进出出。但事实就是如此。这些移动内含子很可能非常古老,在三大域生物的基因组中都存在。而它们又与逆转录病毒不同,从不需要离开宿主基因组这个安乐窝。宿主细胞每复制一次,它们就跟着复制一次。各种生命都只能接受它们的存在。
1700001238
1700001239
细菌很擅长与它们共处,我们不知道这是如何办到的,很可能纯粹就是自然选择作用于大数量种群产生的效果。细菌的内含子如果插入了不当的位置,就会干扰它们的基因,在自然选择的竞争中输给其他内含子位置无害的细菌,最终被淘汰。也有可能是内含子本身的行为很有分寸,只会入侵对宿主细胞基因功能无关紧要的DNA边缘区段。内含子与病毒不同,病毒可以独立生存,所以并不在乎会不会杀死宿主;而移动内含子必须与宿主同生共死,所以在宿主体内捣乱对它们绝无好处。生物学中的这类现象,最适合借用经济学的语言来分析:比如成本收益计算、囚徒困境、博弈论,等等。总之,无论原因是什么,移动内含子没有在细菌和古菌的基因组中大肆扩张,也没有插在任何基因中间,所以严格地说,它算不上是真正的内含子。它们存在于基因之间的非编码区域,而且密度很低。典型的细菌基因组(大约含有4,000个基因)一般带有不超过30个移动内含子,真核生物的基因组则有几万个内含子。细菌基因组中内含子的稀少反映了一种长期的成本收益平衡,这是自然选择在无数代中同时作用于宿主与内含子两方,为它们造就的和局。
1700001240
1700001241
20亿至15亿年前,就是这样一个细菌进入一个古菌宿主体内,二者发生了内共生作用。现代细菌中最接近它的菌种是某种α-变形菌;而我们知道,现代的α-变形菌基因组中只有很少的移动内含子。这些古老的基因寄生物与真核生物基因组结构之间有什么关联呢?我们只需了解“RNA剪刀”的细节机制,再加上简单的逻辑推理,就能一见分晓。前面我提到过剪接体,一种纳米蛋白机器,功能是把内含子从我们的RNA转录本上剪切掉。剪接体并非完全由蛋白质组成,其核心是一把RNA剪刀,和移动内含子的剪刀完全一样。它们剪切真核生物内含子的方式暴露了其来源,即细菌的自剪接内含子(图27)。
1700001242
1700001243
1700001244
1700001245
1700001246
图27 移动自剪接内含子和剪接体
1700001247
1700001248
真核生物的基因由外显子(编码蛋白质的序列)和内含子组成。内含子是长长的非编码序列,插在基因中间;合成蛋白质之前,必须从RNA转录本中把内含子剪切掉。内含子看起来是从细菌基因组中的DNA寄生物部分(左边)演变而来的,但因为突变而衰退,结果变成了真核生物基因组中的非编码插入序列。这些内含子序列必须由剪接体主动去除(右边)。以上的推理,根据的是图中所示的剪接方式。细菌的DNA寄生物(左边)会把自己剪切下来,形成一个游离的内含子序列,编码一个逆转录酶,能够把寄生的基因序列逆转录成DNA,然后把多份拷贝插回细菌基因组。真核生物的剪接体(右边)是个很大的蛋白质复合体,但它的功能依赖于其核心的一段催化性RNA(核酶);而核酶剪接RNA的机制,与细菌的移动II型自剪接内含子相同。这意味着,剪接体以及真核生物的内含子,都是从移动II型自剪接内含子演变而来;这些移动内含子在真核生物演化早期由细菌内共生体释放。
1700001249
1700001250
这就是足够的证明。内含子本身的DNA序列并不足以证明它们源于细菌。内含子不会编码逆转录酶等蛋白质,也不能把自己切入或切出宿主DNA;它们不是活动的基因寄生物,而是DNA序列上的赘疣,无所事事地待在那里。④但这些已经死亡的内含子,被累积的突变完全侵蚀,衰退得不成形状,却远比那些活着的寄生物更危险,因为它们再也无法剪切自己,宿主细胞必须主动移除它们。宿主的办法就是从它们还活着的亲戚那里征用RNA剪刀。剪接体就是一种用细菌基因寄生物改造而成的真核生物机器。
1700001251
1700001252
2006年,俄裔美国生物信息学家尤金·库宁(Eugene Koonin),和我们熟悉的马丁合作发表了一篇非常精彩的论文。他们提出了一个假说:在真核生物诞生之初,内共生体在毫无防备的宿主体内放出了一群基因寄生物。内含子的入侵扩散到整个宿主基因组,塑造了真核生物基因组的基本结构,同时也推动了真核生物某些基本特征的形成,比如细胞核。我再补充一点:性。我承认,这些理论听起来有很多空想成分,像一个勉勉强强的演化故事,而根据的仅仅是一把有故事的剪刀。然而,基因自身的很多构造细节也支持这种假设。内含子的庞大数量(好几万个),再加上它们在基因内部所处的位置,让它们像是沉默的证人,指向远古的遗迹。这个遗迹不只是关于内含子,还包括宿主与内共生体之间曲折而又亲密的关系。我认为,即使这些理论不是全部的真相,这种答案才是我们应该寻求的。
1700001253
1700001254
内含子与细胞核的起源
1700001255
1700001256
许多内含子在真核生物基因组中的位置都固定不变,这是另一个出人意料的谜团。例如一个所有真核生物都有的基因:柠檬酸合酶(citrate synthase)基因。它能转译柠檬酸合酶,参与所有真核生物的基础代谢作用。海藻、蘑菇、树木、阿米巴原虫和人类都有这个基因。我们和树木的这个基因,从共同祖先开始,各自经过无数代演化,在序列上已经出现了些许差异。但是自然选择的作用使它的功能一直保留下来,因此也限定了它的某些特定序列。这个例子完美地证明了共同祖先,也展示了自然选择的分子生物学基础。出人意料的是,不论是树木还是人类,这个基因总是含有2~3个内含子,而且插入位置几乎总是完全一样。为什么会这样呢?只有两个可能的解释。第一个解释是,这些内含子是各自独立插入这些位置的,出于某种原因,这些位置受到自然选择的青睐。第二个解释是,这些内含子在过去某个时刻插入了共祖的基因组,只发生了一次,并传给了所有后代。当然,其中某些后代可能又丢弃了内含子。
1700001257
[
上一页 ]
[ :1.700001208e+09 ]
[
下一页 ]