1700249151
1700249152
然而这是第一个被冷酷无情的实验数据否定的聪明点子,之后还有更多被否定的。所有的重叠密码都会作茧自缚。首先,根据这种编码方式,某个氨基酸一定要排在另一个氨基酸旁边。然而生物化学家弗雷德·桑格尔(这位安静的天才获得了两次诺贝尔奖,一次因为蛋白质测序,一次因为DNA测序)那时正好在帮胰岛素测序(破解胰岛素蛋白质的氨基酸排列顺序)。不久他发现,任何氨基酸都可以排在其他氨基酸旁边,蛋白质的序列没有任何限制。第二个问题是,根据重叠密码理论,任何点突变(也就是一个字母被换成另一个)都会改变一个以上的氨基酸,但是实验结果指出,点突变往往只会改变一个氨基酸。显然真正的密码并没有重叠,伽莫夫的重叠密码理论早在我们知道正确答案之前就被推翻了。基因密码学家已经开始思考我们的大地之母或许就是这么浪费。
1700249153
1700249154
克里克接着提出了另一个十分漂亮的理论,很快就被所有人接受了,他本人却对此有些顾虑,因为该理论尚未被实验证实。克里克结合了许多来自不同分子生物实验室的新发现,特别是沃森在哈佛大学新成立的实验室的结果。沃森那时候钟情于RNA,它像一小段单链的DNA,既存在于细胞核中,也存在于细胞质中。更有趣的是,沃森认为RNA是某个小细胞器的一部分(现在称为核糖体),而这个小细胞器似乎是细胞合成蛋白质的场所。所以沃森认为,DNA长链安静地待在细胞核里不动,而当细胞要生产蛋白质时,其中一小部分序列就可以作为模板,复制出一小段RNA,这一小段RNA则会离开细胞核,与等在外面的核糖体结合。这段敏捷的RNA很快就被命名为“信使RNA”或mRNA。早在1952年,沃森就写信告诉克里克:“DNA合成RNA,RNA合成蛋白质。”而现在克里克真正感兴趣的问题是,这一小段mRNA的字母序列,如何翻译成蛋白质里面的氨基酸序列。
1700249155
1700249156
克里克思考着,他认为mRNA可能需要一系列“适配器”来帮助完成翻译,每一个适配器都负责携带一个氨基酸。当然每一个适配器一定也是RNA,而且都带有一段“反密码子”序列,这样才能和mRNA序列上的密码子配对。克里克认为,RNA的配对原则和DNA的一模一样,也是C配G,A配T,以此类推。[3]在当时适配器分子纯属假设,不过几年之后就有研究证明,确实如克里克所预测的,适配器分子由RNA分子组成。它们现在叫作“转运RNA”或tRNA。现在整个工程变得有点像乐高积木,一块积木接上来又掉下去,一切都顺利的话,它们就会这样一个接一个地搭成精彩万分的聚合物。
1700249157
1700249158
但是克里克猜错了蛋白质的合成机制。在这里我要解释得详细一点,因为实际的机制比克里克所想象的更古怪,但是他的构想可能和这套系统的起源有些关联。克里克认为,mRNA片段悬浮在细胞质里,密码子的部分像母猪乳头般突出,等着tRNA像小猪吸奶般一个个凑上来,和相对应的密码子结合。当所有的tRNA都一个接着一个在mRNA上从头排到尾之后,它们所携带的氨基酸就会像小猪尾巴般留在外面,随时可以被连接起来合成一个大的蛋白质分子。
1700249159
1700249160
克里克理论的问题是,tRNA会随机出现,然后连接到离它最近的密码子上。如果它们不是按顺序从第一个密码子的起点开始,在最后一个密码子的终点结束,那tRNA如何知道它现在所带的这个密码子的第一个字母在哪儿,最后一个字母在哪儿?它们要如何读出一段有意义的信息呢?假设一段序列是ATCGTC,正确的顺序是一个tRNA接到ATC上,另一个接到GTC上,这时候该如何阻止一个认识CGT的tRNA从半路杀出,接到中间的位置上然后毁了整段信息?克里克的答案十分专制,就是不允许这种情况发生。如果要正确无误地读出一段信息,那就不能让每种字母组合都有意义。那么哪些组合必须被剔除?克里克认为所有只含单个字母A、C、U或G所组成的序列都不合格。比如一连串的AAAAAA就不可能含有任何意义。接着他找遍所有可能组合,按照如果ATC有意义,那么同样字母的其他两种组合就必须被剔除的规则筛选(也就是说,如果ATC有意义,那TCA和CAT就不准有意义)。还剩下多少可能的组合?又是不多不少20个!(在64种排列组合里,AAA、UUU、CCC和TTT都被剔除,在剩下的60种组合里,如果每3种排列组合又只有一种有意义,那60除以3就是20种。)
1700249161
1700249162
和重叠密码理论不同的是,克里克的密码组并不会限制氨基酸序列的排列方式,而一个点突变也不会同时改变好几个氨基酸。在当时,他的理论确实完美地解决了序列编码的问题,也将64种密码子成功缩减到20组有意义的密码子,并且和所有已知的数据更吻合。尽管如此,这个理论还是错的。数年之后,实验证明如果合成一段只含AAA密码子的RNA序列(根据克里克的理论,这组密码子无意义),可以合成一种叫作“赖氨酸”的氨基酸,而且也能转换出一条只含赖氨酸的蛋白聚合物。
1700249163
1700249164
随着实验技术进步而且越来越精密,在20世纪60年代中期许多实验室陆续解开了序列密码。然而经过一连串不懈的译码工作后,大自然却好像随兴地给了个潦草结尾,让人既困惑又扫兴。遗传密码子的安排一点也不具创意,只不过“简并”了(意思就是说,冗余)。有三种氨基酸可对应六组密码子,其他的则各对应一到两组密码子。每组密码子都有意义,还有三组的意思是“在此停止”,剩下的每一组都对应一个氨基酸。这看起来既没规则也不美,根本就是“美是科学真理的指南”这句话的最佳反证。[4]甚至,我们也找不出任何结构上的原因来解释密码排列,不同的氨基酸与其对应的密码子间似乎并没有任何物理或化学的关联。
1700249165
1700249166
克里克称这套让人失望的密码系统为“冻结的偶然”,而大部分人也只能点头同意。他说这个结果是冻结的,因为任何解冻(试图去改变密码对应的氨基酸)都会造成严重的后果。一个点突变也许只会改变几个氨基酸,而改变密码系统本身却会从上到下造成天大灾难。就好似前者只是一本书里无心的笔误,并不会改变整本书的意义,然而后者却将全部的字母转换成毫无意义的乱码。克里克说,密码一旦被刻印在石板上,任何想改动它的企图都会被处以死刑。这个观点至今仍有许多生物学家认同。
1700249167
1700249168
但是大自然的“偶然”密码系统却给克里克带来一个问题。为什么只有一个偶然?为什么不是好多个偶然?如果这套密码系统是随机产生的,那理论上它不会优于其他密码系统,因此也不会有什么自然选择“瓶颈效应”让这套密码系统胜出。用克里克的话来说就是,其优势远超其他密码系统,因而独活下来。但是既然没有选择的瓶颈,那为什么现今没有好几套密码系统,存在于不同的生物体内呢?
1700249169
1700249170
答案很明显,那就是地球上所有的生物都是来自同一个共祖,而这套密码系统早在共祖身上就决定好了。更哲学一点的说法就是,生命只在地球上诞生了一次,才使得这套密码系统看上去如此独特、罕见甚至反常。对于克里克而言,这暗示了一次感染、一次播种。他猜测生命是由某个外星生物,将一个类似细菌的东西播种到地球上。他甚至进一步推测,认为细菌是外星人用宇宙飞船送到地球上的,他称这一理论为“定向泛种论”,并在1981年出版的《生命:起源与本质》里详细阐述了该理论。如同科普作者马特·里德利给克里克写的传记所说:“这个主题让许多人大开眼界。伟大的克里克竟写出外星生命乘坐宇宙飞船在宇宙间播种的故事,他是被成功冲昏头了吗?”
1700249171
1700249172
偶然密码系统这样的概念,是否可以证明上述的生命观,取决于个人判断。但这个理论是在说,密码本身并不需要任何优势或劣势来决定能不能突破瓶颈,只需某种偶然情况就可以选择某些特定生命,甚至是某些不可思议的意外,比如小行星撞击地球,就可以毁灭掉所有生命只留下一种,然后就产生了一套唯一的密码系统。无论如何,克里克写作的时机不对。因为早在20世纪80年代初期,克里克还在写书的时候,我们已经渐渐了解到这套密码系统既不是意外,也没有被冻结。在这套密码里暗藏着另一套固定模式,是一种“密码子里面的密码”,将带给我们一条关于40亿年前生命起源的线索。现在我们终于知道这套密码,并不是当初被密码学家嫌弃的雕虫小技,而是唯一一套可以同时耐受各种变异又加快进化脚步的密码。
1700249173
1700249174
这是一套夹带在密码子中的密码!其实从20世纪60年代开始,科学家已经注意到这套密码系统里面似乎存在某种模式,不过大部分的研究,包含克里克自己都忽略了,觉得那只是统计上的误差。然而整体来看,这套密码里面就算有模式,也显得意义不大。为什么模式看起来似乎没有意义呢?来自美国加州的生物化学家布莱恩·戴维斯就在研究这个问题,他一直对遗传密码的来源非常感兴趣。戴维斯认为许多人因为认同“冻结的偶然”,失去了研究密码来源的兴趣,因为如果只是偶然,那又何必研究呢?而剩下的少数科学家,则被流行的原始汤理论所误导。如果这套密码是从原始汤中诞生,那么这些分子的基本结构,必定是某些可以在原始汤中通过物理或化学反应产生的分子。如果是这样,那应该会有一小群氨基酸曾是形成遗传密码的基础,后来再渐渐加入其他的氨基酸。恰好也有一些证据似乎支持这种假设(虽然并不正确)。事实上,只有当我们从生物反应的角度来看待密码,也就是当原始细胞开始利用氢和二氧化碳为自己制造生命建材时,其中的模式才有意义。
1700249175
1700249176
这些难解的模式是什么?所有三联密码的第一个字母都有特定的对应方式。第一个字母之所以引人注目,是因为它与前体合成氨基酸的反应有关。该对应方式让人十分诧异,需要好好解释一下。今天的细胞通过一连串的生物化学反应,把数个简单的前体合成一个氨基酸。让科学家惊讶的是,这些前体似乎都和三联密码的第一个字母有某种关系,举例来说,所有以丙酮酸为前体合成的氨基酸,它们密码的第一个字母都是T。[5]我这里用丙酮酸举例,是因为在第一章我们已经见过它了。我们提到这种分子可以在碱性热泉,经由矿物催化剂的帮助,通过氢和二氧化碳反应合成。然而不只是丙酮酸,所有氨基酸的前体,都是克氏循环这个生命基础化学反应的一部分,因此都可以在前面提过的碱性热泉中合成。也就暗示了热泉和三联密码的第一个字母有某种程度的关联,我承认现在这样说还很牵强,不过后面会详述。
1700249177
1700249178
那么三联密码的第二个字母有没有意义?第二个字母和氨基酸是否容易溶于水有关,或者说和氨基酸的疏水性有关。亲水性氨基酸会溶于水,疏水性氨基酸不会溶于水,但会溶在脂肪或油里,比如溶在含有脂质的细胞膜里。所有的氨基酸,可以从“非常疏水”到“非常亲水”排列成一张图谱,而正是这张图谱决定了氨基酸与第二个密码字母之间的关系。疏水性最强的六个氨基酸里有五个,第二个字母都是T,所有亲水性最强的氨基酸第二个字母都是A。介于中间的有些是G有些是C。总结来说,不管是什么原因,三联密码的前两个字母和它翻译的氨基酸之间确有关联。
1700249179
1700249180
最后一个字母是造成密码简并的主因,其中有八个氨基酸存在所谓的四重简并(科学家爱死这种术语了)。一般人听到这个词可能会在脑海里面想象一个摇摇晃晃的醉汉,连续掉进四条水沟。但是当生物化学家这么讲的时候,意思是三联密码的第三个字母不含任何信息,那么不管接上哪一个字母都没关系,这组密码子都会翻译出一样的氨基酸。以甘氨酸为例,它的密码子是GGG,但是最后一个G可以代换成T、A或C,这四组三联密码都编码甘氨酸。
1700249181
1700249182
第三个字母的简并性暗示了一些有趣的事情。前面提过,二联密码可以编码16种氨基酸。如果我们从20个氨基酸里拿掉5个结构最复杂的(剩下15个氨基酸,再加上一个终止密码子),这样前两个字母与这15个氨基酸特性之间的关联就更明显了。因此,最原始的密码可能只是二联密码,后来才靠“密码子捕捉”的方式成为三联密码,也就是各氨基酸彼此竞争第三个字母。如果是这样,那么最早的15个氨基酸在“接手”第三个字母时,很可能会“作弊”。比如说,那15个由初期二联密码所编码的早期氨基酸,占用了如今的53组密码(总共有64组),也就是每个氨基酸平均使用3.5组密码子,而剩下5个比较晚出现的氨基酸只使用了8组密码子,平均每个氨基酸才用1.6组密码子。显然早起的鸟儿有虫吃。
1700249183
1700249184
好,现在就假设最原始的密码是二联密码而非三联密码,它们总共负责编码15个氨基酸(外加一个终止密码子)。这套早期的密码看起来似乎非常符合决定论,也就是说,早期密码完全由物理或化学因素形成。第一个字母和氨基酸前体之间的关系直截了当,而第二个字母又和氨基酸的疏水性相关。“偶然”在这里恐怕没太多插手的机会,因为物理定律不容许任何偶然。
1700249185
1700249186
但是第三个字母却是另外一回事。这个位置有很大的弹性,因此可以随机选择,所以就有可能让自然选择去选出一个“最适当”的字母。至少这是生物学家劳伦斯·赫斯特和斯蒂芬·弗里兰在20世纪90年代末提出的大胆主张。他们当时把天然基因密码和计算机随机产生的几百万组密码拿去比对,结果轰动一时。他们想知道,如果发生点突变这种把一个字母换掉的变异,哪一套密码系统最经得起考验。最经得起考验的密码系统应该能保留最多正确的氨基酸,或将它代换成另一个性质相似的氨基酸。结果他们发现,天然的基因密码最经得起突变的考验。点突变常常不会影响氨基酸序列,而如果突变真的改变了氨基酸,也会由另一个物理特性相似的氨基酸来取代。据此,赫斯特与弗里兰宣称,天然的遗传密码比成千上万套随机产生的密码要优良得多。它不但不是大自然密码学家愚蠢而盲目的作品,而且是万里挑一的密码系统。他们还说,这套密码除了可以忍受突变,还可以降低灾难发生时造成的损失,因此可以加快进化的脚步。因为如果突变不是灾难性的,那应该会带来更多的好处。
1700249187
1700249188
除非承认存在神明,不然唯一能解释这种杰作的就是自然选择。如果这是真的,那生命的密码就是进化出来的。事实上,我们已经发现这套“通用”的遗传密码,在细菌和线粒体之间存有一些细小的差异,如果这不是由其他因素造成的,那说明它们的密码系统确实可以在某些特殊情况下进化。但你也许会问,这样的改变为什么没有造成如克里克所说的破坏呢?答案是偷偷地改。如果一个氨基酸使用四组甚至六组密码子,那么其中也许有几组会更常用,那些较少用的就可以分配给其他不同(但是性质相似)的氨基酸,而不会造成灾难,如此一来密码系统就进化了。
1700249189
1700249190
总的来说,密码子中的密码是自然法则催生的,开始的时候,它和氨基酸的合成以及可溶性有关,接着则是增加多样性以及优化。那么现在的问题是,哪一种自然法则作用在谁身上?又是如何作用的呢?
1700249191
1700249192
关于这点目前还没有肯定的答案,同时也还有许多难题尚未解决。最先遇到的难题就是蛋白质与DNA两者谁先谁后,这种类似于鸡生蛋蛋生鸡的问题。因为DNA分子活性比较低,它需要特定蛋白质的帮助才能完成自我复制。但反过来讲,特定的蛋白质不是无缘无故产生的,它们需要经过自然的筛选,而要通过自然选择,它们就必须能被遗传且能产生变异。然而蛋白质本身不是遗传的模板,它要由DNA编码。所以问题就是,蛋白质没有DNA就无法进化,而DNA没有蛋白质也无法进化。如果两者缺一不可,那进化就永远无法发生。
1700249193
1700249194
在20世纪80年代中期,科学家有一项超凡的发现,那就是RNA可以当作催化剂。RNA分子很少形成双螺旋,它们常卷成小而复杂的形状,同时具有催化作用。这样一来RNA分子就可以打破前面的困境。在假设的“RNA世界”里面,RNA既可以扮演DNA的角色也可扮演蛋白质的角色,它可以催化自我复制以及很多其他反应。现在密码不再是DNA的专属,它也可以通过RNA和蛋白质的直接作用来产生。
1700249195
1700249196
从现代细胞工作的角度来看,该假设是有意义的。今天的细胞里,氨基酸并不会和DNA直接接触,当细胞需要合成蛋白质时,许多基础反应都是由“RNA酶”(叫作核酶)催化完成的。“RNA世界”这个词,出自沃森的哈佛同事沃尔特·吉尔伯特发表在《自然》上的一篇论文。该论文是现在有史以来阅读量最多的文章之一。该假设对学界有着催眠般的影响力,它让生命密码的研究方向,从“DNA密码如何编码蛋白质”转向“RNA和氨基酸之间到底发生了什么”,然而至今我们仍没有明确的答案。
1700249197
1700249198
在对RNA世界充满兴趣的氛围之下,你也许会很惊讶,小片段RNA分子的催化性质竟然被忽略了。如果较大的RNA分子具有催化能力,那么很小片段的RNA分子,像单个或一对字母组成的那种RNA,或许也有催化力,尽管能力没大段的那么强。最近受人景仰的美国生物化学家哈德罗·莫洛维兹,与分子生物学家谢利·科普利以及物理学家埃克里·史密斯合作,指出了这种可能性。他们的构想或许不完全对,不过我认为在解释生命密码起源时,这就是我们所需要的理论。
1700249199
1700249200
莫洛维兹他们假设由一对字母组成的RNA(术语称为双核苷酸)也可以作为催化剂。他们认为双核苷酸会和氨基酸的前体(比如丙酮酸)结合,然后催化它们成为氨基酸。至于催化成哪一种氨基酸,则要看双核苷酸里的字母是什么(规则就如前面讨论过的)。理论上第一个字母会决定氨基酸的前体,第二个字母决定反应形式。比如说,如果两个字母是UU,那么丙酮酸会先接上来,然后被转换成疏水性极强的亮氨酸。同时莫洛维兹也为这个简单而迷人的构想,提供了许多可行的反应机制,让它们看起来可行。不过我还是希望有一天能看到这些反应真的在试管里发生。
[
上一页 ]
[ :1.700249151e+09 ]
[
下一页 ]