打字猴:1.70024951e+09
1700249510 学界称这种爆炸现象为“辐射”,就是一种特定形态的原型生物不知何故开始繁衍,短暂地进入一段毫无羁绊的进化时光。各种新式生物不断以原型为圆心往各种方向进化,就好像自行车轮的辐条一般。寒武纪大爆发当然是最为知名的一次事件,但是还有很多其他的例子,比如生物登上陆地开始繁衍、开花植物的出现、草原的蔓延、哺乳动物的多样性发展等,种类繁多,写也写不完。每当有前途的基因遇到环境中的机遇时,似乎必定会出现这种现象,就像每次大灭绝之后必定会出现复苏时期。不论原因为何,这种壮观的辐射现象,可是百分之百由真核生物造成的。每一次都只有真核生物旺盛繁衍,而细菌自始至终都还是细菌。有时候不得不承认,我们极为重视,并试图在宇宙其他角落寻找生命的特质——人类智慧与知觉,似乎不可能由细菌产生。至少在地球上,这些特质是真核生物独有的。
1700249511
1700249512 这两者的差异非常明显,尽管细菌拥有种种让我们真核生物汗颜的生物化学反应机制,但它们潜力完全局限在微小的外形中。它们几乎不可能发展出随处可见的奇迹,比如蜂鸟或木槿花之类的东西。而简单细菌过渡为复杂真核细胞,恐怕也是我们星球上最为重要的转变了。
1700249513
1700249514 达尔文并不太喜欢断层。因为自然选择的基本概念是一系列渐进的变化,一点一点改良个体。这也就是说,理论上我们应该可以找到更多的中间过渡形态。达尔文在他的《物种起源》里面提到了这个问题,根据他的定义,所有现在所见“进化终点”的生物都会比过去任何过渡阶段的生物适应性更强。根据自然选择,比较差劲的形态会输给较佳的竞争者。显然,翅膀发育良好的小鸟能顺利飞翔,应该会比其他只能勉强用笨拙“残肢”的同类过得舒服。就好像新的计算机软件会慢慢取代旧的版本。你还记得上次看到Windows 286或386系统(指微软在1988年出的Windows 2.1系统软件)是什么时候吗?这些系统软件过去都是了不起的产品,就好像原型翅膀与其他同时代产物相比较一样。然而随着时间推移,旧的系统软件渐渐消失退出历史舞台,仿佛现在的软件(就说Windows XP好了[1])出现之前是一大段空白。虽然我们都知道Windows系统随着时间在改进,但是如果只看正在使用的系统软件,恐怕很难证明这点,除非偶尔在仓库里找到一些已经报废了的老古董计算机。对于生命来说也是如此,如果我们想证明渐进进化是存在的,那一定要细细分析化石记录,要细细分析那段改变发生时期的记录。
1700249515
1700249516 化石记录当然还有很多漏洞,但是已知的中间型化石远多于那些宗教狂热者愿意承认的。在达尔文写书的年代,人类和人猿之间确实有一段“缺失的环节”,那时候还没有找到带有中间型特征的人科化石。但是半个世纪过去了,人类考古学家已经找到很多化石,每一个特征都正如预测,刚好落在进化该有的位置上,不管是脑容量或步态。现在的数据不是不够,而是多到让人犯难。我们不知道在众多化石中到底哪一个(如果在其中的话)才是人类的直系祖先,而哪一些又毫无理由地凭空消失了。因为我们尚未找到答案,所以一直会听到有人大声宣称缺失的环节从来没有被找到。这显然严重违背了真理与事实。
1700249517
1700249518 不过身为一个生物化学家,对我来说,化石虽然漂亮却容易让人迷失。因为形成化石的过程罕见且充满不确定性,同时无可避免地对那些躯体柔软生物不利,比如水母,以及生活在旱地的动物与植物。理论上,化石不可能完整地保存过去。如果它们真的保存了所有的记录,我们反而会觉得是场骗局。在偶然的机会下,万一有化石真的保存了完整的历史记录,那科学家会高兴得像挖到宝一样,这可是需要一连串多如繁星的事件,奇迹似的彼此配合才能办到。但是再高兴,化石证据也只是用来验证自然选择的证据之一。而其他重要的证据其实一直在我们手中,在这个遗传学的时代,它们就存在于基因序列里。
1700249519
1700249520 基因序列保存了比化石更多的关于自然选择的证据。随便挑一段基因来看,它的序列是一长串的字母,字母顺序编码了构成蛋白质的氨基酸序列。一个蛋白质通常由好几百个氨基酸组成,其中每一个氨基酸都由DNA序列的三联密码编码(请见第二章)。我们前面说过,真核细胞的基因里经常夹杂着大段大段的非编码DNA序列,把可编码的序列切割成许多小片段。两者相加,一个基因序列会有好几千个字母。生物都有好几万个基因,每个基因都这样组成。整体来说,基因组是一长条写满了亿万个字母的缎带,而这些字母的顺序,可以告诉我们缎带主人数不尽的进化故事。
1700249521
1700249522 从细菌到人类,都可以找到某些相同的基因编码相同的蛋白质,它们做着相同的工作。在进化的漫长历史中,基因序列如果发生有害突变,就会被自然选择剔除。这会造成一种结果,就是让相同基因的相同位置,尽量保持相同的字母。从实用的观点来看,这让我们可以辨识出不同生物体内的相关基因,尽管这些生物可能在不知道多久以前就分家了。不过根据经验,一个基因的数千个字母里面往往只有一小部分是真正的关键,其他部分则因为影响较小,允许有一定改动而不至于被剔除,随着时间流逝,这些突变也会累积下来。时间越久累积越多,两个基因序列间的差异就越大。刚从同一个共祖分家出来的两个物种,比如说黑猩猩和人类,就有非常多的基因序列一模一样。而共祖比较久远的物种,比如说黄水仙和人类,相同的基因序列就相对较少。其实和语言的变迁很像,语言也会随着时间与人类迁移而改变,慢慢地失去与共祖的相似性,但是在某些地方还是会不经意地流露出彼此曾有的关联。
1700249523
1700249524 基因树就是根据不同物种基因序列之间的差异来绘制的。虽然说基因突变的累积有一定程度的随机性,不过在对比基因中数千个字母时,这种随机性会被平均掉,最后可以得到亲缘关系的统计概率。单单比对一个基因,我们就可以建立起所有真核生物的谱系树,而且它的准确度是以前的化石猎人一辈子都不敢想象的。如果你对这个谱系树有任何怀疑,那只要再找第二个基因重复一次,看看结果是否相同就行了。所有真核生物共有的基因,没有数千也有数百个,所以科学家可以一再重复同样的比对,一次又一次把新算出来的谱系树重叠在旧的上面。借助现代计算机的威力,最后我们可以画出一棵“一致的”谱系树,显示出所有真核生物之间最可能的亲缘关系。该方法和研究化石断层有很大的差异。它可以清楚地告诉我们,人类和植物、真菌、藻类等生物到底有多少差异(见图4.2)。达尔文对于基因当然是一无所知,但是今天却靠着基因,才能够弭平达尔文世界观中各种讨人厌的断层。
1700249525
1700249526 不过方法虽然好,却也不是万无一失。麻烦主要来自统计学度量久远时光时出现的误差问题。简单来说因为DNA只有四个字母,而突变(至少此处对我们来说有用的那种突变)会把原来的字母换成另一个字母。如果每个字母都只突变一次,那就没有问题,但不巧的是,在漫长的时光中,每个字母都会突变很多次。既然每次突变就像抽奖一样,我们其实并不知道这个字母是被换了五次还是十次。如果基因中一个字母和共祖一样,我们其实不会知道这个字母是从来就没突变过,还是已经突变了很多次,而每次都有25%的机会换回原来的字母。因为这种比对分析法的基础是统计概率问题,到了某个时间点我们将无法分辨出任何差异。更不巧的是,好像屋漏逢连夜雨,这个即将溺毙我们的统计不确定性模糊的时间点,差不多就是真核细胞出现的时刻。原核细胞过渡到真核细胞的关键时刻,就这样被一波波基因的不确定浪潮所淹没。唯一的解决之道,就是要用更细致的统计筛子,慎选比对所用的基因。
1700249527
1700249528
1700249529
1700249530
1700249531 图4.2 一棵典型的生命树,显示所有真核生物与原始共祖之间的差异与距离,这个共祖很可能是活在10亿年前的真核单细胞生物。越长的树枝代表着越长的进化距离,也就表示两者之间的基因序列差异越大。
1700249532
1700249533 真核细胞体内的基因大致分为两大类:一类和细菌一样,另一类则归真核细胞独有,也就是在细菌世界中尚未发现类似的基因。[2]这些独特的基因被我们称为“真核标志基因”,而它们的来源则是现在生物学家激烈争执的源头。有些人主张这些基因证明真核生物的历史和细菌一样古老到令人刮目相看。他们认为真核细胞之所以有这么多独特的基因,一定是因为它们早在盘古开天辟地以来就和细菌分家了。但是假设它们分异的速率不变(也就是说如果突变像一座分子时钟一样嘀嗒嘀嗒地以稳定的速率发生的话),那么根据现在这些基因差异的程度来看,我们应该相信真核细胞在50亿年前就出现了,也就是比地球的出现还要早近4亿年。借用英国擅长揭丑的讽刺杂志《第三只眼》所说的挖苦名言:其中必有错误吧。(“Shurely shome mishtake”,最初由该杂志模仿醉酒的编辑所创造的句子,故意拼写错误,原是“surely some mistake”意为“肯定有些错误”。)
1700249534
1700249535 其他人则认为,既然我们不可能知道基因过去进化得有多快,也没理由相信基因分异的速率会像时钟般稳定发生,那真核标志基因根本无法告诉我们多少真核细胞进化来源的信息,况且我们确实也知道某些基因进化的速度快过其他基因。用分子时钟去测量遥远的过去得到如此奇怪的结果,意味着两种可能:要么生命是从外太空播种到地球上的(但对我来说这不过是个借口而已),不然就是这个分子时钟坏了。可是为什么这个时钟会错得如此离谱呢?因为事实上,基因进化的速率受很多因素影响,不同生物的基因进化速率也不一样。比如之前我们讲过,细菌本身就非常保守,它们永远都是细菌,但是真核细胞则倾向发生剧烈的改变,会造成如寒武纪大爆发之类的事件。不过从基因的观点来看,大概没有什么事件会比形成真核细胞本身要更剧烈了,我们有理由相信真核细胞在早期进化的日子里,基因改变的速度必定非常惊人。如果如大部分学者所想,真核细胞出现于细菌之后,那它们的基因应该与细菌差异很大,因为它们曾进化得非常快速,不断地突变、结合、复制然后再突变。
1700249536
1700249537 那么由于真核标志基因发展得太快,快到把它们的源头淹没在遥远的时间之雾里,已经无法再告诉我们什么。那么另外一类基因呢?那些和细菌共有的基因呢?现在这些基因就显得有用多了,我们可以比对它们的相似性。真核细胞和细菌共有的基因所负责的,往往都是细胞的核心程序,比如说核心代谢反应(产生能量的方式,或用来制造构成细胞的基本材料,如氨基酸和脂质等),或者是核心信息处理方式(比如读取DNA序列然后转录成有用蛋白质的方式)。这些核心程序进化的速度往往比较缓慢,太多东西都依赖它们。制造蛋白质程序的任何一点点改变就会改变所有的蛋白质,而不止是一两个。同样,稍微改变一点点产生能量的方式,就可能干扰整个细胞的运作。因为篡改核心程序比较容易受到自然选择的惩罚,所以这些基因进化缓慢,让我们可以有机会细细分析进化的痕迹。利用这类基因建立的生命树,理论上来说应该可以显示出真核细胞与细菌之间的关联。它们应该可以指出真核细胞来自哪些细菌,搞不好还可以告诉我们为什么。
1700249538
1700249539 美国的微生物学家卡尔·乌斯在20世纪70年代末首先完成了这种生命树。乌斯选择了一个负责细胞核心信息处理的基因,具体来说,他选择的是编码核糖体的部分基因,而核糖体正是帮细胞合成蛋白质的细胞器。因为某种技术上的原因,乌斯并没有直接比对这个基因,而是用了这个基因转录出来的RNA序列(叫作核糖体RNA或rRNA),一被转录出来就会马上嵌进核糖体。乌斯从许多细菌和真核细胞中把这些rRNA分离出来,判读它们的序列,然后互相比对建立起一棵树。实验的结果非常惊人,直接挑战了传统学界对于生命分类方式的看法。
1700249540
1700249541 乌斯发现,我们地球上的所有生命可以大致分为三大类,或者称为三域(见图4.3)。如大家所预期的,第一大类就是细菌(属于细菌域),而第二大类是真核细胞(真核生物域)。但是剩下的第三大类,如今称为古细菌的(属于古菌域),不知从哪里冒出来登上世界舞台。虽然距离人类发现少量的古细菌已过去近一个世纪,但在乌斯提出他的生命树模型之前,古细菌一直被认为只是属于细菌的一个小分支而已。但在乌斯看来,这些古细菌和真核细胞一样重要,尽管在外形上它们看起来和细菌一模一样。它们体积极小,通常外围都有细胞壁,缺乏细胞核,细胞质里面也一样乏善可陈。同时古细菌从来就不会聚集成结构复杂的菌落,你绝不可能把它们和多细胞生物搞混。对很多人来说,抬高古细菌的身价,等同于藐视我们所属的生命世界,等于把植物、动物、真菌、藻类和原虫等各式各样的生物挤到无足轻重的角落去,而让原核生物占据生命树的大部分位置,如此重组世界未免太过鲁莽。这等于乌斯要我们相信,动物和植物之间的种种明显差异,相较于细菌与古细菌中间那道看不见的鸿沟,其实轻如鸿毛。该主张激怒了当时许多德高望重的生物学家,比如恩斯特·迈尔和琳恩·马古利斯等人。多年后《科学》杂志回顾了这场激烈交锋,写文评价乌斯是“微生物界的疤面革命先锋”。
1700249542
1700249543
1700249544
1700249545
1700249546 图4.3 由 rRNA 为基础绘制的生命树。乌斯根据它将生命分成三大域:细菌域、古菌域与真核细胞(真核生物域)。
1700249547
1700249548 如今风暴过去之后,大部分的科学家都渐渐接受了乌斯的生命树,或者至少认可了古细菌的重要性。从生物化学的角度来看,不管在哪方面古细菌和细菌都大相径庭。首先,组成两者细胞膜的脂质不同,而且是由两套不同的酶系统制造的。古细菌的细胞壁成分和细菌的完全不一样,体内的生物化学代谢过程也相去甚远。另外我们在第二章曾说过,这两种细菌控制DNA复制的基因也没有太大的关联。如今全基因组分析技术已如家常便饭,因此我们知道古细菌只有不到三分之一的基因和细菌一样,剩下的全都特立独行。总结来说,乌斯碰巧用RNA建立的基因树,凸显了古细菌与细菌之间一系列的生物化学差异。尽管这些差异从外表来看是如此低调不引人注意,但所有证据加起来都支持乌斯大胆的分类主张。
1700249549
1700249550 乌斯的生命树所带来的第二个意料之外的发现,则是真核生物与古细菌之间的密切关联。它们两者有相同的祖先,和细菌关系较远(见图4.3)。换句话说,古细菌与真核细胞本来有一个共祖,且很早以前就和细菌分家了,之后才各自形成现在的古细菌与真核细胞。而生物化学上的证据,至少在十分重要的几个方面,支持乌斯的这项结论。特别是古细菌与真核细胞的核心信息处理方式有许多相似之处。两者的DNA都缠绕在相似的蛋白质(组蛋白)上面,基因复制与读取的方式也很相近,而制造蛋白质的整套机制也无分别。这一切一切的细节,都和细菌十分不同,所以从某些方面来看,古细菌填补了一些缺失的环节,它们横跨了真核细胞与细菌之间的那道鸿沟。大体来说,古细菌在外表和行为上和细菌一样,不过在处理蛋白质与DNA的方式上,开始有一些真核生物的特色了。
1700249551
1700249552 然而乌斯的生命树有个问题,它是依照单一基因绘制,无法与其他的基因树重叠以达到统计上的效力。只有相信一个基因可以确实反映真核细胞的遗传与起源的情况下,我们才能采用单一基因来绘制生命树。而要验证这点唯一的办法,就是去比对其他进化速度一样缓慢的基因,看看它们是不是也显示出相同的生命树分支结构。但是当我们这么做了之后,结果却让人十分困惑。如果我们只使用三者共有的基因(也就是在细菌、古细菌和真核生物三域里都可以找到的基因),那么建立的生命树很清楚地显示出细菌与古细菌的关系,但是真核细胞却不行,真核细胞混杂的程度让人完全摸不着头脑。我们细胞中有些基因似乎来自古细菌,其他的似乎来自细菌。最近一次大规模的分析,收集了165种不同种的生物,结合了5700个基因分析比对,绘制出了一株“超级生命树”。然而科学家发现,研究越多基因,越发现真核细胞并非遵循传统达尔文式进化,反而比较像通过某种庞大的基因融合而进化。从遗传学的观点来看,第一个真核细胞应该是个“嵌合体”,也就是半个真细菌、半个古细菌。
1700249553
1700249554 根据达尔文的观点,生命是经由慢慢累积的一连串变异,渐渐变得多元,而每一分支也因此与它们共同祖先渐渐分道扬镳,最终会形成一株繁茂的生命树。所以生命树无疑最适合用来描绘我们可见的众多生物进化过程,特别是大部分大型的真核生物。然而反过来看,生命树明显不是用来描绘微生物进化最好的方式,不管是古细菌、真细菌或真核细胞。
1700249555
1700249556 有两个过程总是会干扰达尔文式的基因树,那就是“水平基因转移”与“全基因组融合”。对于微生物系统分类学者来说,在试图建立细菌与古细菌之间的亲缘关系时,频繁发生的水平基因转移总是让人沮丧。这个复杂术语的意思,简单来说就是基因被传来传去,像钞票一样由一个细菌传给另一个。这样会造成一种结果,那就是一个细菌传给后代的基因组,可能与它的亲代一样,也可能不一样。有些基因倾向“垂直”遗传,一代传给下一代,像乌斯使用的rRNA。但是也有很多基因会被大家换来换去,而且常发生在毫无关联的微生物间。[3]因此最后描绘出来的图像往往会介于树状与网状之间,根据某些核心基因(如rRNA)可以画出树形图,但是用其他的基因则会画出网状图。有没有任何一群核心基因从来没有被水平基因转移传来传去过?该问题一直让众人争执不休。如果没有这样一群基因,那么想追溯真核细胞的祖先到某几群特定原核细胞的想法,无异缘木求鱼。这样一群基因必须一直通过直系继承,而不会被随机传来传去,才有可能被当成历史身份的标记。但是反过来说,如果只有一小群核心基因从来没有被传来传去,而所有其他基因都被传来传去,那这小群基因又怎么能代表身份呢?如果大肠菌有99%的基因都被随机置换掉,那它还是大肠菌吗?[4]
1700249557
1700249558 基因组融合也带来了类似问题,它让达尔文式的生命树走回头路,不但不发散,反而开始收敛。这样一来问题就变成了到底哪两位(或更多)父母的基因才代表进化路径。如果我们只追踪rRNA的话,那确实会得到一株达尔文式的生命树,然而如果考虑更多的基因,或把整个基因组都算进去,那会得到一个环状树,它的树杈一开始发散出去,但是后来则会收敛,最后合并在一起(见图4.4)。
1700249559
[ 上一页 ]  [ :1.70024951e+09 ]  [ 下一页 ]