1700260895
而这也正是所有生命起源假说都不得不面对的最艰巨的难题:40亿年前,碱基序列是如何与氨基酸建立起严格的对应关系,形成遗传密码的?RNA根据遗传密码催化合成蛋白质的复杂系统,又是如何建立起来的?
1700260896
1700260898
·冻结的偶然?·
1700260899
1700260900
遗传密码是碱基序列与氨基酸的对应方式。具体来说,就是碱基每3个一组,构成一个“密码子”,对应1种氨基酸。碱基一共有4种,可以形成64个密码子,而细胞直接用于合成蛋白质的标准氨基酸却只有20种,所以遗传密码必然有所冗余,大部分的氨基酸都对应了多个密码子——这些内容已在第六章里详细讲述过。
1700260901
1700260902
图2—44就是标准密码子的图示,所有已知的细胞和病毒,都是根据它建立碱基序列和氨基酸的对应关系的。这显然是一份来自末祖的遗产,也是我们追溯遗传密码起源的最重要的第一手资料。
1700260903
1700260904
面对这样一份标准遗传密码,我们萌生的第一个疑问当然就是“密码子与氨基酸为什么会有这样的对应关系”,比如说,“GGU”为什么对应甘氨酸,“CUU”为什么对应亮氨酸,“GAG”为什么对应谷氨酸?
1700260905
1700260906
对此,第一个重要的意见来自弗朗西斯·克里克,他是遗传学奠基时代的灯塔人物。1953年,他与富兰克林等人共同发现了DNA的双螺旋和碱基互补配对原则。1957年,他提出了中心法则的标准流程[1]。1961年,他又确定了密码子是3个碱基一组,连续且不重叠。在此基础上,1966年,人类破解了全部遗传密码,才得到了上面那份标准遗传密码。
1700260907
1700260908
1968年,面对这份标准遗传密码,弗朗西斯·克里克提出,它的起源只是个偶然。碱基序列与氨基酸反正得有个对应关系,不是这样也得是那样,在生命诞生的极早期,不同的元祖完全可以有各不相同的遗传密码。但只有极少数幸运的元祖留下了存活至今的后代,如今所有的生命越发可能只来自同一个最幸运的末祖,当然就都偶然继承了其中的某一套遗传密码。而遗传密码又是遗传的根本,任何微小的变动都可能把所有遗传信息变成乱码。所以,这个偶然就被后世的每一个细胞严格固定下来,墨守成规,历经40亿年的进化也绝难改变。反过来,如果当年是别的元祖发展成了延续至今的生命,标准密码子就会是另一副模样了。
1700260909
1700260910
原本只是一个偶然,但偶然在至关重要的地方,一旦发生就无法改变——这被克里克形象地称为“冻结偶然假说”I。
1700260911
1700260912
当然,在生命这样的涨落系统上,我们几乎说不出任何绝对的东西,遗传密码也不例外。标准遗传密码固然涉及遗传的根本,但是某些不那么关键的冗余密码子,却可能在进化中出现一些细小的变化,成为“非标准遗传密码”。比如“UGA”在标准密码表里是“终止”,表示翻译结束,但在高等哺乳动物体内却编码了色氨酸;“AGG”本来编码了精氨酸,但在绝大多数真核生物的线粒体内却表示“终止”;而“CUG”本来是亮氨酸的编码,却在某些真菌体内编码了丝氨酸。
1700260913
1700260914
凡此种种,囿于篇幅和主题,我们就不做过多的介绍了。但仍然要强调的是,非标准遗传密码虽然是些例外,但也只是标准遗传密码的极其细微的局部修改,而不是另外一套独立的遗传密码。所以,一切外星病毒感染地球生命的科幻故事,全都是无稽之谈。哪怕抛开生命的各种可能性全都不谈,后退无穷步非要假设外星病毒的遗传物质也是DNA和RNA,也用这4种碱基3个一组编码20种氨基酸,那也意味着超过1084种编码方案,这个数字恐怕比可观测宇宙中的原子总数还大,外星病毒与我们采用同一套遗传密码的概率实在太低了。它们要用我们的细胞制造有生化功能的蛋白质,就好像一个从来没有接触过中文的英国人要把“东边日出西边雨,道是无情却有晴”翻译成地道的英语,还要保留所有的平仄、韵脚和修辞,这是根本不可能的事情。
1700260915
1700260916
在今天看来,冻结偶然假说在很大程度上是正确的,体现了一切进化现象的原则性问题。毕竟,进化建立在随机突变上,偶然本来就是进化的左腿。但是,进化又不是个纯粹的偶然,自然选择无处不在,所以密码子的起源又恐怕不是这么简单。如果把所有密码子与它们对应的氨基酸用不同的方式排列起来,我们又会发现,这三位密码子中的每一位都有独立规律。
1700260917
1700260918
首先,早在20世纪70年代和80年代,生物化学家们就发现,密码子的第一位碱基与氨基酸的合成原料[2]有着显著的对应关系II:
1700260919
1700260920
◆ 第一位碱基是A的7种氨基酸中,有5种的合成原料是α-酮戊二酸;
1700260921
1700260922
◆ 第一位碱基是C的5种氨基酸中,有3种的合成原料是草酰乙酸;
1700260923
1700260924
◆ 第一位碱基是U的6种氨基酸,合成原料全都包含丙酮酸[3];
1700260925
1700260926
◆ 第一位碱基是G的4种氨基酸没有统一的合成原料,但全都能以同一类的有机酸[4]为原料,以相同的反应合成出来。
1700260927
1700260928
1700260929
1700260930
1700260931
图4—33 标准遗传密码第一位碱基与氨基酸的对应关系。横行代表密码子的第一位,竖列代表密码子的第二位,氨基酸名称后括号里的是密码子的第三位,左侧的三种α-酮酸是三种主要的氨基酸合成前体。除了密码子第一位是G的氨基酸以外,其他氨基酸都与用来合成它的α-酮酸拥有相同的背景色,黑色圆点代表氨基酸与α-酮酸对应的碳原子。这幅图实际上与图2—44是一样的。(作者绘)
1700260932
1700260933
如果考虑密码子的冗余性,排除重复的密码子,比如排除C开头的亮氨酸、A开头的丝氨酸和精氨酸,我们会更惊讶地发现,除了组氨酸[5],所有的氨基酸都服从这种对应关系。第一位碱基就对应了它们的合成原料,至于那几种原料就更有意思了,如果你除了丙酮酸就再没有听说过别的,不妨对照一下图2—13或者图3—2,就会发现这几种α-酮酸全都是三羧酸循环的成员。在第三幕里,我们反复强调过三羧酸循环是物质代谢的中央环线,说的就是这件事,还畅想过逆三羧酸循环一旦启动就能成为氨基酸的来源,说的也是这件事。
1700260934
1700260935
接着,密码子的第二位与对应氨基酸的亲水性有关。
1700260936
1700260937
所谓亲水性,就是氨基酸除去羧基和氨基之后,余下的部分是亲和水分子,还是排斥水分子,这是氨基酸最重要的性质之一。对照标准密码子和各种氨基酸的亲水性,我们发现,密码子第2位是U的氨基酸总是疏水性最强,是A的亲水性最强,C和G居中,而C又要略强一点——当然,这个规律就没法那么绝对了,我们可以看到很多例外。
1700260938
1700260939
至于密码子的第三位,它就是那种“冗余”的集中体现了:20种标准氨基酸里,有8种氨基酸的第三位密码子随便是什么都行,只有甲硫氨酸的第三位密码子必须是G。
1700260940
1700260941
这是很容易理解的事情,因为前两个密码子只能编码16种氨基酸,不够20种,而有了第三位,就能编码64种氨基酸,远远超过20种,当然会有大量的重复。但是,这第三位的冗余又不是完全随机的,除了8种任意的和1种唯一的,其余13种氨基酸的第三位普遍都是同种碱基,要么都是嘌呤,A或G,要么都是嘧啶,U或C,只有异亮氨酸是个例外,它与那个唯一的编码相邻,所以第三位碱基可以是A、U、C。
1700260942
1700260943
以上讨论的,就是标准遗传密码里的规律了。既然所有的生命都遵循这套密码,显然,这些规律也必然出现在末祖身上,很可能就关系着遗传密码的起源。从这些规律出发,生物化学家们提出了“冻结偶然”之外的多种假说,2009年,第七章里提到的启发了白烟囱假说的尤金·库宁集中评价了其中影响最大的三个假说IV。
1700260944
[
上一页 ]
[ :1.700260895e+09 ]
[
下一页 ]