打字猴:1.700249519e+09
1700249519
1700249520 基因序列保存了比化石更多的关于自然选择的证据。随便挑一段基因来看,它的序列是一长串的字母,字母顺序编码了构成蛋白质的氨基酸序列。一个蛋白质通常由好几百个氨基酸组成,其中每一个氨基酸都由DNA序列的三联密码编码(请见第二章)。我们前面说过,真核细胞的基因里经常夹杂着大段大段的非编码DNA序列,把可编码的序列切割成许多小片段。两者相加,一个基因序列会有好几千个字母。生物都有好几万个基因,每个基因都这样组成。整体来说,基因组是一长条写满了亿万个字母的缎带,而这些字母的顺序,可以告诉我们缎带主人数不尽的进化故事。
1700249521
1700249522 从细菌到人类,都可以找到某些相同的基因编码相同的蛋白质,它们做着相同的工作。在进化的漫长历史中,基因序列如果发生有害突变,就会被自然选择剔除。这会造成一种结果,就是让相同基因的相同位置,尽量保持相同的字母。从实用的观点来看,这让我们可以辨识出不同生物体内的相关基因,尽管这些生物可能在不知道多久以前就分家了。不过根据经验,一个基因的数千个字母里面往往只有一小部分是真正的关键,其他部分则因为影响较小,允许有一定改动而不至于被剔除,随着时间流逝,这些突变也会累积下来。时间越久累积越多,两个基因序列间的差异就越大。刚从同一个共祖分家出来的两个物种,比如说黑猩猩和人类,就有非常多的基因序列一模一样。而共祖比较久远的物种,比如说黄水仙和人类,相同的基因序列就相对较少。其实和语言的变迁很像,语言也会随着时间与人类迁移而改变,慢慢地失去与共祖的相似性,但是在某些地方还是会不经意地流露出彼此曾有的关联。
1700249523
1700249524 基因树就是根据不同物种基因序列之间的差异来绘制的。虽然说基因突变的累积有一定程度的随机性,不过在对比基因中数千个字母时,这种随机性会被平均掉,最后可以得到亲缘关系的统计概率。单单比对一个基因,我们就可以建立起所有真核生物的谱系树,而且它的准确度是以前的化石猎人一辈子都不敢想象的。如果你对这个谱系树有任何怀疑,那只要再找第二个基因重复一次,看看结果是否相同就行了。所有真核生物共有的基因,没有数千也有数百个,所以科学家可以一再重复同样的比对,一次又一次把新算出来的谱系树重叠在旧的上面。借助现代计算机的威力,最后我们可以画出一棵“一致的”谱系树,显示出所有真核生物之间最可能的亲缘关系。该方法和研究化石断层有很大的差异。它可以清楚地告诉我们,人类和植物、真菌、藻类等生物到底有多少差异(见图4.2)。达尔文对于基因当然是一无所知,但是今天却靠着基因,才能够弭平达尔文世界观中各种讨人厌的断层。
1700249525
1700249526 不过方法虽然好,却也不是万无一失。麻烦主要来自统计学度量久远时光时出现的误差问题。简单来说因为DNA只有四个字母,而突变(至少此处对我们来说有用的那种突变)会把原来的字母换成另一个字母。如果每个字母都只突变一次,那就没有问题,但不巧的是,在漫长的时光中,每个字母都会突变很多次。既然每次突变就像抽奖一样,我们其实并不知道这个字母是被换了五次还是十次。如果基因中一个字母和共祖一样,我们其实不会知道这个字母是从来就没突变过,还是已经突变了很多次,而每次都有25%的机会换回原来的字母。因为这种比对分析法的基础是统计概率问题,到了某个时间点我们将无法分辨出任何差异。更不巧的是,好像屋漏逢连夜雨,这个即将溺毙我们的统计不确定性模糊的时间点,差不多就是真核细胞出现的时刻。原核细胞过渡到真核细胞的关键时刻,就这样被一波波基因的不确定浪潮所淹没。唯一的解决之道,就是要用更细致的统计筛子,慎选比对所用的基因。
1700249527
1700249528
1700249529
1700249530
1700249531 图4.2 一棵典型的生命树,显示所有真核生物与原始共祖之间的差异与距离,这个共祖很可能是活在10亿年前的真核单细胞生物。越长的树枝代表着越长的进化距离,也就表示两者之间的基因序列差异越大。
1700249532
1700249533 真核细胞体内的基因大致分为两大类:一类和细菌一样,另一类则归真核细胞独有,也就是在细菌世界中尚未发现类似的基因。[2]这些独特的基因被我们称为“真核标志基因”,而它们的来源则是现在生物学家激烈争执的源头。有些人主张这些基因证明真核生物的历史和细菌一样古老到令人刮目相看。他们认为真核细胞之所以有这么多独特的基因,一定是因为它们早在盘古开天辟地以来就和细菌分家了。但是假设它们分异的速率不变(也就是说如果突变像一座分子时钟一样嘀嗒嘀嗒地以稳定的速率发生的话),那么根据现在这些基因差异的程度来看,我们应该相信真核细胞在50亿年前就出现了,也就是比地球的出现还要早近4亿年。借用英国擅长揭丑的讽刺杂志《第三只眼》所说的挖苦名言:其中必有错误吧。(“Shurely shome mishtake”,最初由该杂志模仿醉酒的编辑所创造的句子,故意拼写错误,原是“surely some mistake”意为“肯定有些错误”。)
1700249534
1700249535 其他人则认为,既然我们不可能知道基因过去进化得有多快,也没理由相信基因分异的速率会像时钟般稳定发生,那真核标志基因根本无法告诉我们多少真核细胞进化来源的信息,况且我们确实也知道某些基因进化的速度快过其他基因。用分子时钟去测量遥远的过去得到如此奇怪的结果,意味着两种可能:要么生命是从外太空播种到地球上的(但对我来说这不过是个借口而已),不然就是这个分子时钟坏了。可是为什么这个时钟会错得如此离谱呢?因为事实上,基因进化的速率受很多因素影响,不同生物的基因进化速率也不一样。比如之前我们讲过,细菌本身就非常保守,它们永远都是细菌,但是真核细胞则倾向发生剧烈的改变,会造成如寒武纪大爆发之类的事件。不过从基因的观点来看,大概没有什么事件会比形成真核细胞本身要更剧烈了,我们有理由相信真核细胞在早期进化的日子里,基因改变的速度必定非常惊人。如果如大部分学者所想,真核细胞出现于细菌之后,那它们的基因应该与细菌差异很大,因为它们曾进化得非常快速,不断地突变、结合、复制然后再突变。
1700249536
1700249537 那么由于真核标志基因发展得太快,快到把它们的源头淹没在遥远的时间之雾里,已经无法再告诉我们什么。那么另外一类基因呢?那些和细菌共有的基因呢?现在这些基因就显得有用多了,我们可以比对它们的相似性。真核细胞和细菌共有的基因所负责的,往往都是细胞的核心程序,比如说核心代谢反应(产生能量的方式,或用来制造构成细胞的基本材料,如氨基酸和脂质等),或者是核心信息处理方式(比如读取DNA序列然后转录成有用蛋白质的方式)。这些核心程序进化的速度往往比较缓慢,太多东西都依赖它们。制造蛋白质程序的任何一点点改变就会改变所有的蛋白质,而不止是一两个。同样,稍微改变一点点产生能量的方式,就可能干扰整个细胞的运作。因为篡改核心程序比较容易受到自然选择的惩罚,所以这些基因进化缓慢,让我们可以有机会细细分析进化的痕迹。利用这类基因建立的生命树,理论上来说应该可以显示出真核细胞与细菌之间的关联。它们应该可以指出真核细胞来自哪些细菌,搞不好还可以告诉我们为什么。
1700249538
1700249539 美国的微生物学家卡尔·乌斯在20世纪70年代末首先完成了这种生命树。乌斯选择了一个负责细胞核心信息处理的基因,具体来说,他选择的是编码核糖体的部分基因,而核糖体正是帮细胞合成蛋白质的细胞器。因为某种技术上的原因,乌斯并没有直接比对这个基因,而是用了这个基因转录出来的RNA序列(叫作核糖体RNA或rRNA),一被转录出来就会马上嵌进核糖体。乌斯从许多细菌和真核细胞中把这些rRNA分离出来,判读它们的序列,然后互相比对建立起一棵树。实验的结果非常惊人,直接挑战了传统学界对于生命分类方式的看法。
1700249540
1700249541 乌斯发现,我们地球上的所有生命可以大致分为三大类,或者称为三域(见图4.3)。如大家所预期的,第一大类就是细菌(属于细菌域),而第二大类是真核细胞(真核生物域)。但是剩下的第三大类,如今称为古细菌的(属于古菌域),不知从哪里冒出来登上世界舞台。虽然距离人类发现少量的古细菌已过去近一个世纪,但在乌斯提出他的生命树模型之前,古细菌一直被认为只是属于细菌的一个小分支而已。但在乌斯看来,这些古细菌和真核细胞一样重要,尽管在外形上它们看起来和细菌一模一样。它们体积极小,通常外围都有细胞壁,缺乏细胞核,细胞质里面也一样乏善可陈。同时古细菌从来就不会聚集成结构复杂的菌落,你绝不可能把它们和多细胞生物搞混。对很多人来说,抬高古细菌的身价,等同于藐视我们所属的生命世界,等于把植物、动物、真菌、藻类和原虫等各式各样的生物挤到无足轻重的角落去,而让原核生物占据生命树的大部分位置,如此重组世界未免太过鲁莽。这等于乌斯要我们相信,动物和植物之间的种种明显差异,相较于细菌与古细菌中间那道看不见的鸿沟,其实轻如鸿毛。该主张激怒了当时许多德高望重的生物学家,比如恩斯特·迈尔和琳恩·马古利斯等人。多年后《科学》杂志回顾了这场激烈交锋,写文评价乌斯是“微生物界的疤面革命先锋”。
1700249542
1700249543
1700249544
1700249545
1700249546 图4.3 由 rRNA 为基础绘制的生命树。乌斯根据它将生命分成三大域:细菌域、古菌域与真核细胞(真核生物域)。
1700249547
1700249548 如今风暴过去之后,大部分的科学家都渐渐接受了乌斯的生命树,或者至少认可了古细菌的重要性。从生物化学的角度来看,不管在哪方面古细菌和细菌都大相径庭。首先,组成两者细胞膜的脂质不同,而且是由两套不同的酶系统制造的。古细菌的细胞壁成分和细菌的完全不一样,体内的生物化学代谢过程也相去甚远。另外我们在第二章曾说过,这两种细菌控制DNA复制的基因也没有太大的关联。如今全基因组分析技术已如家常便饭,因此我们知道古细菌只有不到三分之一的基因和细菌一样,剩下的全都特立独行。总结来说,乌斯碰巧用RNA建立的基因树,凸显了古细菌与细菌之间一系列的生物化学差异。尽管这些差异从外表来看是如此低调不引人注意,但所有证据加起来都支持乌斯大胆的分类主张。
1700249549
1700249550 乌斯的生命树所带来的第二个意料之外的发现,则是真核生物与古细菌之间的密切关联。它们两者有相同的祖先,和细菌关系较远(见图4.3)。换句话说,古细菌与真核细胞本来有一个共祖,且很早以前就和细菌分家了,之后才各自形成现在的古细菌与真核细胞。而生物化学上的证据,至少在十分重要的几个方面,支持乌斯的这项结论。特别是古细菌与真核细胞的核心信息处理方式有许多相似之处。两者的DNA都缠绕在相似的蛋白质(组蛋白)上面,基因复制与读取的方式也很相近,而制造蛋白质的整套机制也无分别。这一切一切的细节,都和细菌十分不同,所以从某些方面来看,古细菌填补了一些缺失的环节,它们横跨了真核细胞与细菌之间的那道鸿沟。大体来说,古细菌在外表和行为上和细菌一样,不过在处理蛋白质与DNA的方式上,开始有一些真核生物的特色了。
1700249551
1700249552 然而乌斯的生命树有个问题,它是依照单一基因绘制,无法与其他的基因树重叠以达到统计上的效力。只有相信一个基因可以确实反映真核细胞的遗传与起源的情况下,我们才能采用单一基因来绘制生命树。而要验证这点唯一的办法,就是去比对其他进化速度一样缓慢的基因,看看它们是不是也显示出相同的生命树分支结构。但是当我们这么做了之后,结果却让人十分困惑。如果我们只使用三者共有的基因(也就是在细菌、古细菌和真核生物三域里都可以找到的基因),那么建立的生命树很清楚地显示出细菌与古细菌的关系,但是真核细胞却不行,真核细胞混杂的程度让人完全摸不着头脑。我们细胞中有些基因似乎来自古细菌,其他的似乎来自细菌。最近一次大规模的分析,收集了165种不同种的生物,结合了5700个基因分析比对,绘制出了一株“超级生命树”。然而科学家发现,研究越多基因,越发现真核细胞并非遵循传统达尔文式进化,反而比较像通过某种庞大的基因融合而进化。从遗传学的观点来看,第一个真核细胞应该是个“嵌合体”,也就是半个真细菌、半个古细菌。
1700249553
1700249554 根据达尔文的观点,生命是经由慢慢累积的一连串变异,渐渐变得多元,而每一分支也因此与它们共同祖先渐渐分道扬镳,最终会形成一株繁茂的生命树。所以生命树无疑最适合用来描绘我们可见的众多生物进化过程,特别是大部分大型的真核生物。然而反过来看,生命树明显不是用来描绘微生物进化最好的方式,不管是古细菌、真细菌或真核细胞。
1700249555
1700249556 有两个过程总是会干扰达尔文式的基因树,那就是“水平基因转移”与“全基因组融合”。对于微生物系统分类学者来说,在试图建立细菌与古细菌之间的亲缘关系时,频繁发生的水平基因转移总是让人沮丧。这个复杂术语的意思,简单来说就是基因被传来传去,像钞票一样由一个细菌传给另一个。这样会造成一种结果,那就是一个细菌传给后代的基因组,可能与它的亲代一样,也可能不一样。有些基因倾向“垂直”遗传,一代传给下一代,像乌斯使用的rRNA。但是也有很多基因会被大家换来换去,而且常发生在毫无关联的微生物间。[3]因此最后描绘出来的图像往往会介于树状与网状之间,根据某些核心基因(如rRNA)可以画出树形图,但是用其他的基因则会画出网状图。有没有任何一群核心基因从来没有被水平基因转移传来传去过?该问题一直让众人争执不休。如果没有这样一群基因,那么想追溯真核细胞的祖先到某几群特定原核细胞的想法,无异缘木求鱼。这样一群基因必须一直通过直系继承,而不会被随机传来传去,才有可能被当成历史身份的标记。但是反过来说,如果只有一小群核心基因从来没有被传来传去,而所有其他基因都被传来传去,那这小群基因又怎么能代表身份呢?如果大肠菌有99%的基因都被随机置换掉,那它还是大肠菌吗?[4]
1700249557
1700249558 基因组融合也带来了类似问题,它让达尔文式的生命树走回头路,不但不发散,反而开始收敛。这样一来问题就变成了到底哪两位(或更多)父母的基因才代表进化路径。如果我们只追踪rRNA的话,那确实会得到一株达尔文式的生命树,然而如果考虑更多的基因,或把整个基因组都算进去,那会得到一个环状树,它的树杈一开始发散出去,但是后来则会收敛,最后合并在一起(见图4.4)。
1700249559
1700249560
1700249561
1700249562
1700249563 图4.4 这就是生命之环,最早的生命共祖在底部,然后分开形成代表细菌的左边,与代表古细菌的右边,最后两枝再合而为一形成上方的真核细胞嵌合体。
1700249564
1700249565 真核细胞是一个嵌合体,这点毫无疑问。现在的问题是,典型的达尔文式进化有多重要,猛烈的基因融合又有多重要,或者换个方式来问,真核细胞的所有特质里,有多少是经由母细胞一点一点进化得到的,又有多少是在基因融合发生之后才诞生的?过去几十年来,科学家提出各式各样关于真核细胞起源的理论,范围从天马行空的(如果你不想称之为捏造的话)到利用生物化学证据一点点推理的都有,但至今无一被证实。所有的理论都可以归为两大类,一类强调达尔文式的渐渐分散进化,另一类强调剧烈的基因融合。事实上,这两大类理论恰好反映了生物学早期两派激烈的争执,一派强调进化是经由一连串渐进式的改变而来;另一派则强调一段长期而稳定的静止或平衡,会被突如其来的巨变打断继而进化。以前有人曾经揶揄这两派进化论:奴才进化论对上笨蛋进化论[5]〔evolution by creeps(谄媚奉承的人;缓慢)versus evolution by jerks(傻瓜;快进),可以意指“缓慢的进化对上急变的进化”或“奴才进化论对上笨蛋进化论”〕。
1700249566
1700249567 而在真核细胞的起源上,诺贝尔奖得主克里斯蒂安·德·杜维称这两派为“原始吞噬细胞”假说与“命运邂逅”假说。原始吞噬细胞假说在概念上是达尔文式的,有牛津大学的汤姆·卡瓦利埃-史密斯与杜维支持。该假说的基本原则就是,真核细胞的祖先会慢慢累积各种现代真核细胞的特质,这些特质包括细胞核、性行为、细胞骨架,以及最重要的一项,吞噬能力,让细胞可以四处漫游,改变形状吞噬其他细胞然后在体内慢慢消化。原始吞噬细胞和现代真核细胞唯一不同的,就是它缺少线粒体这个利用氧气来产生能源的小器官。我们假设原始吞噬细胞依赖发酵作用产生的能量生存,当然发酵作用的效率很差。
1700249568
[ 上一页 ]  [ :1.700249519e+09 ]  [ 下一页 ]