1700001233
这个假说给出的最重要一项预测,就是“真核生物最先演化出现”,因为只有真核生物才有真正的内含子。如果内含子真的是原始特征,那么真核细胞必定是最早出现的细胞,早于细菌和古菌。原核生物则是后来在自然选择的压力下,为了精简基因组而丢弃了内含子。从种系发生学的证据来看,这毫无道理。当代的全基因组测序无可争辩地显示,真核生物起源于古菌宿主和细菌内共生体。生命树上最早的分支在细菌和古菌之间,真核生物在更晚期才出现。化石证据和上一章讨论的生物能量学分析也支持这些结论。
1700001234
1700001235
然而,如果内含子不是原始特征,那么它们从何而来,又为什么会出现呢?答案看来是内共生体。我刚才说,细菌没有“真正的内含子”,但内含子的前身必定来自细菌,更准确地说,来自细菌的基因寄生物(bacterial genetic parasites),正式名称是移动II型自剪接内含子(mobile group II self-splicing introns)。不要管这些艰涩的术语,它们其实就是一种自私DNA,一种跳跃基因(jumping genes),在基因组中不断自我复制、跳进跳出。或许我把它们说得太简单了,它们其实是相当厉害、目的明确的小机器。它们也会由正常的转录机制转录成RNA,但之后马上就会“活过来”(没法否认它们是“活物”),把自己组装成RNA“剪刀”。这把剪刀会把基因寄生物从长长的RNA转录本中剪切出来,尽量减少对宿主细胞的伤害。剪下来的片段会形成活跃的复合体,编码一种逆转录酶(reverse transcriptase)。这种酶可以把RNA反向转录成DNA,并将其插回宿主的基因组。所以,移动内含子是一种基因寄生物,在细菌的基因组中不断切进切出。
1700001236
1700001237
“大跳蚤背上咬着小跳蚤……”谁能想到生物的基因组原来就像蛇鼠之窝,精明的寄生虫在里面大行其道,随心所欲进进出出。但事实就是如此。这些移动内含子很可能非常古老,在三大域生物的基因组中都存在。而它们又与逆转录病毒不同,从不需要离开宿主基因组这个安乐窝。宿主细胞每复制一次,它们就跟着复制一次。各种生命都只能接受它们的存在。
1700001238
1700001239
细菌很擅长与它们共处,我们不知道这是如何办到的,很可能纯粹就是自然选择作用于大数量种群产生的效果。细菌的内含子如果插入了不当的位置,就会干扰它们的基因,在自然选择的竞争中输给其他内含子位置无害的细菌,最终被淘汰。也有可能是内含子本身的行为很有分寸,只会入侵对宿主细胞基因功能无关紧要的DNA边缘区段。内含子与病毒不同,病毒可以独立生存,所以并不在乎会不会杀死宿主;而移动内含子必须与宿主同生共死,所以在宿主体内捣乱对它们绝无好处。生物学中的这类现象,最适合借用经济学的语言来分析:比如成本收益计算、囚徒困境、博弈论,等等。总之,无论原因是什么,移动内含子没有在细菌和古菌的基因组中大肆扩张,也没有插在任何基因中间,所以严格地说,它算不上是真正的内含子。它们存在于基因之间的非编码区域,而且密度很低。典型的细菌基因组(大约含有4,000个基因)一般带有不超过30个移动内含子,真核生物的基因组则有几万个内含子。细菌基因组中内含子的稀少反映了一种长期的成本收益平衡,这是自然选择在无数代中同时作用于宿主与内含子两方,为它们造就的和局。
1700001240
1700001241
20亿至15亿年前,就是这样一个细菌进入一个古菌宿主体内,二者发生了内共生作用。现代细菌中最接近它的菌种是某种α-变形菌;而我们知道,现代的α-变形菌基因组中只有很少的移动内含子。这些古老的基因寄生物与真核生物基因组结构之间有什么关联呢?我们只需了解“RNA剪刀”的细节机制,再加上简单的逻辑推理,就能一见分晓。前面我提到过剪接体,一种纳米蛋白机器,功能是把内含子从我们的RNA转录本上剪切掉。剪接体并非完全由蛋白质组成,其核心是一把RNA剪刀,和移动内含子的剪刀完全一样。它们剪切真核生物内含子的方式暴露了其来源,即细菌的自剪接内含子(图27)。
1700001242
1700001243
1700001244
1700001245
1700001246
图27 移动自剪接内含子和剪接体
1700001247
1700001248
真核生物的基因由外显子(编码蛋白质的序列)和内含子组成。内含子是长长的非编码序列,插在基因中间;合成蛋白质之前,必须从RNA转录本中把内含子剪切掉。内含子看起来是从细菌基因组中的DNA寄生物部分(左边)演变而来的,但因为突变而衰退,结果变成了真核生物基因组中的非编码插入序列。这些内含子序列必须由剪接体主动去除(右边)。以上的推理,根据的是图中所示的剪接方式。细菌的DNA寄生物(左边)会把自己剪切下来,形成一个游离的内含子序列,编码一个逆转录酶,能够把寄生的基因序列逆转录成DNA,然后把多份拷贝插回细菌基因组。真核生物的剪接体(右边)是个很大的蛋白质复合体,但它的功能依赖于其核心的一段催化性RNA(核酶);而核酶剪接RNA的机制,与细菌的移动II型自剪接内含子相同。这意味着,剪接体以及真核生物的内含子,都是从移动II型自剪接内含子演变而来;这些移动内含子在真核生物演化早期由细菌内共生体释放。
1700001249
1700001250
这就是足够的证明。内含子本身的DNA序列并不足以证明它们源于细菌。内含子不会编码逆转录酶等蛋白质,也不能把自己切入或切出宿主DNA;它们不是活动的基因寄生物,而是DNA序列上的赘疣,无所事事地待在那里。④但这些已经死亡的内含子,被累积的突变完全侵蚀,衰退得不成形状,却远比那些活着的寄生物更危险,因为它们再也无法剪切自己,宿主细胞必须主动移除它们。宿主的办法就是从它们还活着的亲戚那里征用RNA剪刀。剪接体就是一种用细菌基因寄生物改造而成的真核生物机器。
1700001251
1700001252
2006年,俄裔美国生物信息学家尤金·库宁(Eugene Koonin),和我们熟悉的马丁合作发表了一篇非常精彩的论文。他们提出了一个假说:在真核生物诞生之初,内共生体在毫无防备的宿主体内放出了一群基因寄生物。内含子的入侵扩散到整个宿主基因组,塑造了真核生物基因组的基本结构,同时也推动了真核生物某些基本特征的形成,比如细胞核。我再补充一点:性。我承认,这些理论听起来有很多空想成分,像一个勉勉强强的演化故事,而根据的仅仅是一把有故事的剪刀。然而,基因自身的很多构造细节也支持这种假设。内含子的庞大数量(好几万个),再加上它们在基因内部所处的位置,让它们像是沉默的证人,指向远古的遗迹。这个遗迹不只是关于内含子,还包括宿主与内共生体之间曲折而又亲密的关系。我认为,即使这些理论不是全部的真相,这种答案才是我们应该寻求的。
1700001253
1700001254
内含子与细胞核的起源
1700001255
1700001256
许多内含子在真核生物基因组中的位置都固定不变,这是另一个出人意料的谜团。例如一个所有真核生物都有的基因:柠檬酸合酶(citrate synthase)基因。它能转译柠檬酸合酶,参与所有真核生物的基础代谢作用。海藻、蘑菇、树木、阿米巴原虫和人类都有这个基因。我们和树木的这个基因,从共同祖先开始,各自经过无数代演化,在序列上已经出现了些许差异。但是自然选择的作用使它的功能一直保留下来,因此也限定了它的某些特定序列。这个例子完美地证明了共同祖先,也展示了自然选择的分子生物学基础。出人意料的是,不论是树木还是人类,这个基因总是含有2~3个内含子,而且插入位置几乎总是完全一样。为什么会这样呢?只有两个可能的解释。第一个解释是,这些内含子是各自独立插入这些位置的,出于某种原因,这些位置受到自然选择的青睐。第二个解释是,这些内含子在过去某个时刻插入了共祖的基因组,只发生了一次,并传给了所有后代。当然,其中某些后代可能又丢弃了内含子。
1700001257
1700001258
如果只有少数几个基因是这样,那么我们可能倾向于第一个解释。但发现的事实是,数以千计的内含子都插在数百个真核生物的共有基因中,而且在完全相同的序列位置。这样第一个解释就说不通了。内含子一起插入共祖基因组是更加直截了当的解释。如果的确如此,那么在真核生物诞生之初,很早期就必定有一波内含子入侵,从一开始就插入了这些位置。之后它们又经历了某种突变侵蚀,被剥夺了移动能力,从此就留在这些位置上,一直传给所有真核生物后代,如同尸体周围擦不掉的粉笔轮廓。
1700001259
1700001260
还有一个更有说服力的证据可以支持早期内含子入侵的假说。我们通常把两种不同的基因类型区分为直系同源基因(ortholog)和旁系同源基因(paralog)。直系同源基因基本是继承自共祖的共同基因,在不同物种的体内执行一模一样的功能。例子我们刚才举过:所有的真核生物都有柠檬酸合酶基因这个直系同源基因,都继承自共同祖先。第二类基因即旁系同源基因,同样来自一个共同的祖先,但那个祖先基因却在同一个祖先细胞中经历了多次复制,形成了一个基因家族。这样的基因家族可以包含多达20~30个成员基因,每个成员最终都发生了一些特化,负责稍微不同的工作。血红蛋白家族就是一个例子,大约有10个基因,每个基因都编码很相似的蛋白质,具体功能稍有差别。简单来说,直系同源基因就是不同生物中的相同基因,而旁系同源基因是同一个生物体中的基因家族成员。当然,在不同种的生物中也能找到整个家族的旁系同源基因,它们都遗传自某个共同祖先。例如,所有的哺乳动物都拥有旁系同源的血红蛋白基因家族。
1700001261
1700001262
我们可以再把这些旁系同源基因家族区分为“古老”和“近代”两类。库宁在他精巧的研究中就是这么分的。他把存在于所有真核生物中,但没有在任何原核生物中分化复制过的基因家族,定义为古老旁系同源基因。根据这一定义,我们可以把形成这些基因家族的复制过程,定位到真核生物的早期演化阶段,发生在最后的真核生物共祖出现之前。近代旁系同源基因,是指只有在某些特定的真核生物种类中才有的基因家族,比如动物或植物。这种基因家族内的复制发生得较晚,是在那个特定生物种类的演化中发生的。
1700001263
1700001264
库宁认为,如果真核生物演化早期确实发生了内含子入侵,这些移动内含子应该是随机插入不同的基因中间。在同一时期,古老旁系同源基因正在积极复制,从而形成家族。如果早期内含子入侵尚未停止,那么在旁系同源基因家族扩张的过程中,这些移动内含子就会插到每个新家族成员的不同位置上。相反,对于近代旁系同源基因家族来说,所有家族的扩张复制都发生在内含子入侵之后。因为没有新的插入发生,所以新的家族成员基因应该通过复制保留了原本的内含子位置。简而言之,库宁的预测是,与近代旁系同源基因相比,古老旁系同源基因中内含子的位置应该更不规则。基因组测序的分析结果表明,库宁的预测非常准确。近代旁系同源基因中所有内含子的位置,在家族内部都没有变化,而古老旁系同源基因的内含子位置则十分混乱。
1700001265
1700001266
这些证据全都表明,早期的真核生物确实遭受了内共生体带来的移动内含子入侵。但是这样,为什么这些内含子在细菌和古菌体内受到严格的控制,在真核生物细胞内却大肆扩散呢?有两种可能的解释,而且多半都对。第一个解释是,最早的真核细胞(其实那时基本上还是个原核细胞,底子是一个古菌)基因组遭到了细菌内含子的大轰炸,来源近在咫尺,是从自己的细胞质而来。这就像是棘轮⑤的运作方式。内共生作用是大自然的一个实验,有可能失败。如果宿主细胞死亡,实验也就结束了。反过来却不是这样。如果宿主体内有很多内共生体,其中一个死亡并无大碍,实验可以继续进行;宿主还活着,其他内共生体也活着。但是这个已经死亡的内共生体,会把自己的DNA释放到胞质溶胶中。这些跳船的DNA很可能通过标准的水平基因转移方式,与宿主细胞的基因组发生重组。
1700001267
1700001268
这个实验很难停下来,直到今天仍在继续。我们的核基因组中充斥着数千个线粒体DNA片段,即核内线粒体序列(nuclear mitochondrial sequences),它们就是通过上述机制到达细胞核的。偶尔会出现新近到达的核内线粒体序列,当它们破坏某个基因而导致遗传疾病时,就会引起我们的注意。真核生物诞生之初还没有细胞核,这类基因转移必定更为普遍。如果真的有某种选择机制,可以引导内含子插入基因组中的某些特定位置而避开其他位置,那么混乱的基因转移很可能导致更糟糕的后果。一般来说,细菌内含子已经适应了细菌宿主,而古菌的内含子也适应了古菌宿主。但在早期真核细胞中,细菌内含子入侵的是古菌的基因组,其序列与细菌基因组完全不同。现在没有任何适应性的制约,也就没有什么能阻止内含子失控扩散。结果很可能是种群灭绝。最好的结果,就是一小群基因不稳定的病态细胞。
1700001269
1700001270
第二种解释认为,没有什么自然选择压力来限制早期内含子扩散。部分原因在于,比起一大群健康细胞,一小群病弱细胞之间的竞争要和缓得多。这就要求最初的真核细胞对内含子入侵时具有前所未见的耐受力。毕竟这些内含子都来自内共生体,也就是未来的线粒体。内共生体虽然让基因付出了代价,却也提供了能量上的优势。对细菌来说内含子纯粹是麻烦,因为它们在能量和基因方面是双重负担。上一章我们讲过,DNA含量较少的小细菌,比DNA含量超过需求的大细菌繁殖得快;因此,细菌都会把自己的基因组精简到刚够生存的最小限度。相反,真核生物的基因组表现出一种极端的不对称性:它们可以自由扩充核基因组,正是因为内共生体的基因组不断缩小。宿主细胞并不会有计划地扩充基因组;之所以会扩充,只是因为更大的基因组也不会受到自然选择对细菌那样的惩罚。既然惩罚有限,真核生物就能通过各种各样的基因复制与重组累积起数千个新的基因,同时也能忍受愈加繁重的基因寄生物负担。这两件事必然是一起发生的。真核生物基因组中的内含子泛滥,是因为从能量角度来看,的确容得下它们。
1700001271
1700001272
所以,最初的真核细胞是被自身内共生体放出的基因寄生物大肆轰炸。讽刺的是,这些基因寄生物“活着”的时候没有带来多少问题,反而是它们衰退、死亡之后,麻烦才来了。因为它们的残骸(也就是内含子)像垃圾一样乱扔在整个基因组中。这时宿主细胞就不得不把它们切掉,不然就会转译成毫无意义的蛋白质。如前所述,剪接体就是专门干这个累活的,它源于移动内含子的RNA剪刀。不过,剪接体尽管是精良的纳米机器,也只能解决一部分问题,因为它的速度很慢。直到今天,经过20亿年的演化改良,剪接体还是要花几分钟时间才能切掉一段内含子。偏偏核糖体的工作速度奇快,每秒钟可以组装10个氨基酸,制造一个标准的细菌蛋白质(长度约为250个氨基酸)只需不到半分钟。另外,剪接体要接触到RNA都不容易,因为一段RNA上常常嵌着好几个疯狂工作的核糖体。就算接触到了,它们慢吞吞的工作速度也来不及阻止核糖体生产大量无用的蛋白质,序列中夹杂着没有切出去的内含子。
1700001273
1700001274
细胞如何防止此类错误灾难发生?马丁和库宁认为,在处理过程中插入一道障碍就行了。细胞核膜就是这道障碍,可以把转录和转译两个过程分开。在细胞核中,基因被转录成RNA转录本;在细胞核外,核糖体会读取RNA,再转译成蛋白质。最重要的是,缓慢的剪接过程在细胞核内进行,在核糖体有机会接触到RNA之前已经处理完毕。这就是细胞核真正的意义:把干劲冲天的核糖体挡在外面。这就解释了为什么真核生物需要细胞核,而原核生物不需要。原核生物根本没有内含子的麻烦。
1700001275
1700001276
现在你也许会抗议:“等等!结构完美的核膜不会凭空出现,它一定需要经过很多代才会演化出来。在那之前,为什么早期真核生物没有灭绝呢?”好吧,毫无疑问,很多早期真核细胞在伟大演化实验的半道上牺牲了,但核膜的演化或许没那么难。这里的关键是另一件与细胞膜有关的怪事。基因分析表明,宿主细胞是一个货真价实的古菌,所以它的细胞膜必然含有古菌脂质。但是,今天的真核生物膜却含有细菌脂质。这个现象值得好好思索。在真核生物演化之初,一定有某种原因让宿主细胞的古菌型细胞膜换成了细菌型细胞膜。为什么?
1700001277
1700001278
这个问题有两个方面需要解答。首先是可行性问题:这有可能发生吗?答案是肯定的。各种细菌脂质和古菌脂质混合形成的嵌合膜,其实都是稳定的。这相当出人意料,但已经在实验室里得到证实。所以,古菌的细胞膜确实有可能发生脂质逐渐置换,慢慢过渡成细菌型细胞膜。没有什么原因不允许这发生,但现实中,这样的替换转变非常罕见。这让我们考虑问题的第二个方面:什么罕见的演化力量可能驱动这种改变呢?答案是内共生体。
1700001279
1700001280
从内共生体到宿主的混乱基因转移,一定包括了负责合成细菌脂质的基因。我们可以假设编码的这些酶都被合成出来且具有活性,它们马上开始制造细菌脂质,但合成脂质的过程一开始很可能不受任何控制。当脂质合成随机进行时,会发生什么事呢?如果是在水中合成的,它们会自行析出积聚,形成脂质囊泡。纽卡斯尔大学的杰夫·埃林顿(Jeff Errington)曾用实验证明,活细胞的行为也是这样的。如果诱发某种突变,导致细菌的脂质合成速度加快,多余的脂质就会积聚形成内膜。脂质在自己合成之处附近积聚,结果是围绕着基因组形成了一堆堆脂质“小袋子”。就像流浪汉会用塑料袋裹住自己来御寒(虽然也不怎么顶事),一堆堆脂质小袋子也可以在DNA和核糖体之间临时拼凑起一道不太完美的障碍,减轻一点内含子带来的麻烦。这道障碍其实必须有缺口。完全封闭的膜反而会让RNA无法接触核糖体。而有缺口的障碍只会减缓物质进出的速度,给剪接体多一些时间,在核糖体开始工作之前就切掉内含子。简而言之,一个随机出现(但是可预测)的起始事件,为自然选择提供了塑造解决方案的初始条件。它始于一堆围绕基因组的脂质小袋子,终点是核膜,上面布满了精巧的核孔。
1700001281
1700001282
核膜的形态非常符合这个假设。脂质小袋子就像塑料袋一样,可以被压扁。一个压扁的袋子,其横截面是两片紧贴且平行的膜,即双层膜结构。核膜恰恰就是这种结构。它由一堆压扁的囊泡融合在一起,有很多核孔复合体镶嵌在缝隙中。当细胞分裂时,核膜会散开,还原成分离的小囊泡;分裂完成后,这些小囊泡会生长并再次融合,重新形成两个子细胞的核膜。
[
上一页 ]
[ :1.700001233e+09 ]
[
下一页 ]