打字猴:1.70237763e+09
1702377630 每条RNA序列都有特定的繁殖速度,也就是这条序列的“适应度”。相对适应度较高的序列,其繁殖速度会更快,随着在竞争中逐渐胜过适应度较低的慢速序列,这些高适应度序列的数量也会越来越多。如果将每条给定RNA序列的适应度用纵轴表示,而序列空间用横轴表示,那么我们就得到了具有RNA进化特征的“适应度景观”。
1702377631
1702377632 将上述信息纳入脑海,我们就能想象出,快速复制的序列会形成山脊般的图像,而速度最快的一条则是那最高的山巅。在适应度景观之中,复制速度最慢的序列在最低的山谷中憔悴衰败。而当临近的RNA序列拥有相似的适应度时,就会形成地势平缓的平原图像。这样一来,寻找拥有最佳复制能力RNA序列的工作,就相当于在一片宏大而波澜起伏的适应度景观之中,找到那座最为壮观的波峰。
1702377633
1702377634 不断进化的群体会在一系列小规模遗传变化的作用下,在适应度景观之中不断向上攀升,直到抵达巅峰的位置。而进化的微妙之处就在于,这一给定的巅峰并不一定就是最高点。这样一来,群体很可能会被困在这一点上,直到偶发的突变打开一条通往更高适应性巅峰的全新道路。否则,去往更高巅峰的道路就会从低谷间穿过,这也可以说是“以退为进”这个古老策略在“准种”领域的体现。
1702377635
1702377636 适应度景观是多维的。如果你想要画出这样一个栅格,里面是长度为2和3的二进制序列,那么所需要的维度就要和序列的长度相等。如果想要画出人类免疫缺陷病毒的序列空间,就需要10 000个维度。对于人类的整个遗传互补——人类的基因图谱来说,需要大约30亿个维度。与此相比,生命之初的遗传物质串就要短上许多,但尽管如此,还是超越了人类对其所在的多维空间的构想能力。
1702377637
1702377638 我希望读者能开始理解,进化的各种可能性处于很高的多维空间之中,实际上,这些空间比宇宙本身更为“辽阔”。这些空间如此浩瀚,在一片高维度“喜马拉雅山脉”之中,拥有独特而奇异生命形式的“香格里拉”,很可能如绿洲般存在于适应性景观之中,而穷尽我们宇宙的整个生命周期,进化的机制也很可能无法发现这些绿洲的存在。
1702377639
1702377640 生命的博弈
1702377641
1702377642 艾根和舒斯特于20世纪70年代后期提出“准种”理论之时,他们也创造出了理解生命和进化的新契机。准种可以在高维度的适应度景观中四处游走,寻找巅峰,而这些巅峰代表的正是拥有高度适应值的区域。但艾根和舒斯特认为,自然选择的目标,不是最具适应性的序列,而是最具适应性的准种。这是一个很重要的区别,因为最具适应性的序列可能仅代表准种之中非常小的一部分。事实上,这些序列甚至很可能并不时刻存在。而且,最高的巅峰也许并不与最具适应性的准种相符,随后我会作出进一步解释。
1702377643
1702377644 我们很容易想明白,为什么关于一群彼此之间略有不同的亲缘RNA分子——“准种”思想,会如此的强大。你也许认为,任何单一RNA复制因子的成功,仅取决于其自身自我再造的能力,并因此也取决于其自身的复制速度。但这种观点并不成立。实际上,其成功还要取决于临近突变体的复制速度。原因在于,在适宜的突变之后,这些临近的突变体也能产出原始的RNA复制因子,而相邻的不同序列就能通过突变实现相互“合作”。
1702377645
1702377646 如此一来,自然选择就会挑中最具适应性的一群RNA序列(准种),而非最具适应性的RNA序列本身。在涉及生命的博弈问题上时,其结果很可能是反直觉的。我们来假设有两条RNA序列,A和B。假设A的复制速度比B快,因此A就具有更高的适应值。传统观点认为,A会在生命这场博弈之中获胜。是否正确?请先不要急着下结论。
1702377647
1702377648 我们假设A周围布满适应度很低的突变体。这样,A就位于高耸的顶峰之上。而B周围的突变体则具有相对较高的适应度,更像是处于一座平顶山上。平顶山的高度要低于A所在的尖峰。从彼得·舒斯特在维也纳大学与乔格·斯维蒂纳(Jörg Swetina)共同得出的数学研究成果中可以看出,随着突变不断加速,A会在与B展开的竞争中败下阵来。因此存在一个关键的突变速度,在这一速度之下,A就会获胜,而超过这一速度,B及其邻居们就会受到追捧,而这一数据可以通过“准种等式”得出。
1702377649
1702377650 准种理论还有其他一些重要结论。生物学专业的学生从学习专业课的第一天起,就要将突变的随机性深深植入脑海:突变没有指定的方向,其发展是盲目的。但正如我们了解到的一样,进化完全不是盲目而随机的。这就意味着,最适合环境的突变体更倾向于繁荣发展。现在我们知道,选择可以作用于准种的结构,并指导准种沿着山脊来到最近的巅峰。这种现象之所以会发生,是因为更加成功的突变体与稍为逊色的突变体(离巅峰距离较远)相比,能产出更多的子孙后代。
1702377651
1702377652 在这一思想诞生之前,人们很可能会以为,进化的过程就是在适应度景观中完全随机的游荡。换句话说,就是在多维序列空间中的一系列步伐,而行进到空间之中某一区域的可能性不会比其他任何区域更高。但研究证明,由于选择和准种的力量,在行进于生命遗传可能性之中时,进化过程是会出现偏好的。
1702377653
1702377654 超级合作者 [:1702376324]
1702377655 艾根悖论,自我复制的分子链不能太长也不能太短
1702377656
1702377657 进化所衍生出来的无数奇妙的可能性,是复制过程中出现失误的结果。突变是十分关键的。如果RNA的复制臻于完美,没有失误,那么就不会出现突变体,而进化也会停止前进的脚步。一切都不会再发生变化,也没有生命的多样性。因此,生命的出现是以突变为条件的。同样,如果复制的失误率过高,进化也不可能成为现实。原因在于,只有一些突变能引发适应性的提升,而绝大部分突变则会带来恶化和负面影响。
1702377658
1702377659 通过计算我们不难发现,如果在某一次复制过程中出现了太多的失误,那么随着遗传信息的混乱,RNA分子群体就无法维持足量有意义的信息,以传递给下一代。因此,当突变率超越某一个精确界定的临界值时,遗产和传承就会土崩瓦解。于是,对于适合某种环境的RNA准种来说,一旦逾越了失误率的临界值,就再没有任何对该环境的适应性可言。艾根和舒斯特发现,有办法可以找到这一失误临界值的具体位置,并用在任何突变率下都会兴旺发展的可能的最大序列长度,来表示这一临界值。
1702377660
1702377661 假设在RNA序列繁殖之时,存在发生拼写失误的某一给定概率。可以想见,RNA序列的长度越长,其中包含的错误就越多。就好像你想要手写出越长的一句话,写出错别字的可能性越大一样。这样,我们就能将失误临界值确定为传承遗传信息能力过于退化的RNA长度。对于拥有100个“字母”(被称为“基”的化学单元)的RNA来说,想要完成信息传承的工作,那么每100个字母中,发生突变的字母数量必须小于1。而对于有1 000个字母的RNA来说,每1 000个字母中的突变量也要小于1。因此,突变率的最大可能性必须小于基因组长度的倒数。这样,就能拥有足量携带正确信息的后裔,并继续将信息传递给子孙后代。
1702377662
1702377663 美国圣地亚哥索尔克研究所(Salk Institute)的莱斯利·奥格尔(Leslie Orgel)对RNA的自发复制进行了实验(没有使用生化酶)。结果证实,失误率大概在1/20左右。这一数字指出了原生基因组的上限在20左右。如果幸运的话,这一数字可以高达100,越高越好。因为RNA越长,利用RNA自身减少突变率的机会就越多。
1702377664
1702377665 单链RNA常常因为单元基相互配对、形成发夹结构,而纠缠打结。由此产生的复杂形状就使其有了作为生化酶的能力,能够加快化学反应,帮助修正失误。在生命初始之时,由于失误率很高,遗传复制的发生速度通常非常缓慢。而原始RNA生化酶成了“复制游戏”中妥善安排各位化学“玩家”的模板,也许正是因为RNA生化酶的出现,才使得复制工作能够更加准确地进行下去。维持生命延续的生物化学环境是如此的复杂,在创造这一环境的过程中,RNA生化酶的出现给我们带来了希望。
1702377666
1702377667 然而,我们还是要记住艾根在失误问题上的研究成果。是否可能出现足够长的RNA,能够制造出具有失误修复能力的酶?RNA在自发复制过程中,其失误率介于每20个字母拼错1个到每100个字母拼错1个之间不等。假设后面这个数字为实际失误率(保持乐观态度)。这一失误临界值说明,能够得以进化的最长RNA,有100个基那么长。艾根认为,对于能作为复制酶的RNA生化酶来说,这样的长度还是太短,无法进行充分编码。复制酶,就是提高RNA复制速度并降低突变率的一种酶。
1702377668
1702377669 那么,如何才能生成足够规模的RNA,使从中得来的RNA生化酶能够确保复制的准确性?有些人将这一问题与艾根提出的悖论联系在一起:失误临界值的概念限制了自我复制分子的大小,而生命却需要长得多的分子链,才能容纳得下遗传信息的编码。艾根认为,如果不考虑修正失误的酶,那么复制分子链最长可达100个字母左右。但为了让复制分子链能容纳下失误修正酶的编码,则必须要比100个字母长出许多才行。这就是为什么失误临界值的概念对于生命原初的时刻具有如此重要的意义。
1702377670
1702377671 1989年,彼得·舒斯特跟我一起,针对我的硕士毕业论文展开了研究,那时我关注的重点是失误临界值理论。舒斯特与艾根利用无限大的群体作为研究对象(虽然听起来有些吓人,但实际上却相对更容易进行分析),而我的工作则是对他们的研究成果进行精炼,以适应规模有限的群体。结果,我得出了一个简洁的短式,希望能借此博得一些专家的肯定。原来,在规模有限的群体中,突变率的最大可能性比在无限大的群体中要小。因此,在有限规模群体这个较为实际的条件之下,失误临界值的问题就显得更加尖锐。对于给定的突变率来说,能够实现适应性(在适应度景观中寻找巅峰并占领山头)的基因组的最大长度就更短了。这就意味着,克服艾根悖论变得难上加难。
1702377672
1702377673 然而,我们知道,这样的限制是能够克服的。如今,这个星球上充满了包含巨大分子链的各种生命。在我们的身体中,生化酶是体型完美而庞大的蛋白质,能够异常精准地以某种特定的方式来加速化学反应,从而确保复制过程中的失误率能够维持在最低限度。地球上每一个生命体的存在,都告诉我们,进化的过程已经找到了办法来绕开这一难题。
1702377674
1702377675 “超循环”合作机制
1702377676
1702377677 实际上,在生命的“22条军规”中,合作给出了解决办法。在这个问题中,合作以所谓“超循环”的形式出现。这是一个由相互依存的RNA分子组成的循环,每一个分子都在进行自我繁殖的化学反应,并同时帮助循环中的下一个分子进行繁殖。
1702377678
1702377679 这是一个充满活力的模型,对超循环中各个组成部分如何相互协作给出了概略性的描述。每一个复制因子都足够小,不会达到失误限制,这样就可以保持复制工作的高保真度。而且,任何一个复制因子都无法独占鳌头,因为在整体的组合结构之中,RNA分子之间必须相互依存才能取得成功的结果。通过组建一个由独立RNA序列所组成的超循环,而其中的每一个RNA序列都低于信息失误的临界值,就可以存储下更多的遗传信息,还可以有能力制造出检查失误并修正失误的蛋白质。
[ 上一页 ]  [ :1.70237763e+09 ]  [ 下一页 ]