1700255293
1700255294
图4-3 两种折叠方式相似的血红蛋白
1700255295
1700255296
豆科植物与昆虫球蛋白的氨基酸差异极大,但这种差异稀松平常。哪怕对于两种动物球蛋白而言,很可能有80%的氨基酸也是不同的,比如蛤和鲸。尽管有种种差异,上述以及其他生物体体内的上千种球蛋白仍然彼此相关联,组成一张网络,遍布蛋白质图书馆。这张网络上的通路连续不断,从共同祖先出发,每走一步改变一个氨基酸,但文本含义保持不变。
1700255297
1700255298
类似的基因型网络我们已经在代谢图书馆中探讨过了,无论生物进化在这张网络中往哪个方向走,走多远,代谢表现型的意义总是保持不变。进化在探索蛋白质图书馆的过程中采用了一种不同的策略,不是基因水平转移,而是改变单个氨基酸,但两者的本质是相同的。基因型网络将不同的球蛋白连接在一起,网络的根须触手一直延伸至蛋白质图书馆的深处。进化可以沿着这个网络探索图书馆,不致迷路而陷进由无用分子围成的致命流沙中。
1700255299
1700255300
球蛋白形成的基因型网络规模庞大、交错纵深并不是例外,而是普遍规律。折叠方式、催化反应以及祖先相同的酶,它们的氨基酸的相似度通常不超过20%。我们能认识到这一点,是因为科学家已经在图书馆里确定了上千种已知酶的编码文本位置。通过给文本编目,我们能够绘出酶的基因型网络在图书馆中的通路,其中有一些甚至比球蛋白延伸得更远。延伸最远的是TIM桶状蛋白质,TIM是磷酸丙糖异构酶(triose phosphate isomerase)的首字母缩写。由于α-螺旋和β-折叠的排列方式像木桶夹板,所以这种酶被称作桶状蛋白。TIM有助于从葡萄糖中摄取能量。令人震惊的是,有些以相同方式进行折叠的酶与TIM没有一个氨基酸相同。它们分别位于蛋白质图书馆的对角位置,即所有字母都互不相同,尽管如此,它们却携带着相同的化学信息。这些蛋白质就像无数个不同版本的《哈姆雷特》,尽管不同版本的4 000行台词中只有几百行相同,甚至没有一行相同,但每个版本都完整地讲述了莎翁笔下那个王子复仇的故事。
1700255301
1700255302
自然实验室中的上千种蛋白质同样叙述了一个类似的故事:不管是酶、调节因子还是像血红蛋白那样的运输分子,当我们需要一个新的蛋白质解决眼前的问题时,解决方案往往多得数不过来。不仅如此,应对相同问题的蛋白质由一张众多蛋白质文本构成的巨网相连,遍布蛋白质图书馆。在某些蛋白质网络中我们已经能够认出数千种蛋白质了,可是这也只是沧海一粟,要知道,一张网络中具有相同表现型的蛋白质往往多达数万亿个。
1700255303
1700255304
有些未知的蛋白质属于早已灭绝的生物,但是绝大多数蛋白质甚至从未在自然界出现过。生命历经的40亿年太短,只够创造出1050种蛋白质,这只占蛋白质图书馆所有文本中的极小一部分。不论巨大的生命之树上挂着多少蛋白质,也不论这棵树有多么高大、多么美丽,它终究只是脏兮兮的镜子里污迹斑斑的影像,是柏拉图的理想世界中模糊不清的幻影,唯有背后那张更大的基因型网络才是这一切的本质。
1700255305
1700255306
1700255307
1700255308
1700255309
我们在第3章里看到,在进化过程中,有几十亿读者通过基因型网络探索着代谢图书馆各个角落里的不同社区。尽管有些探索者掉下网络一命呜呼,但也有一些探索者通过网络发现了新表现型的进化文本。基因型网络或许同样可以服务于蛋白质,前提是蛋白质图书馆里的社区也具有多样性。否则,进化的蛋白质还不如待在原地不动。因为如果图书馆不同区域堆放的书籍相同,也就没有探索图书馆的必要了。
1700255310
1700255311
图书馆中每个蛋白质附近书架上的文本是否意义相近,是否就像现代社区中大同小异的家家户户?还是更像中世纪的村庄,风格独特,魅力各异,所含蛋白质拥有独一无二的新功能?尽管我们研究了几十年蛋白质,如今甚至可以用计算机挖掘堆积如山的蛋白质数据,但是对于这个问题,直到现在我们也没有找到答案。
1700255312
1700255313
要回答这个问题,光有计算机还不够,还需要热爱书本的图书管理员。一个年轻的智利研究者埃万德罗·费拉达(Evandro Ferrada)带着这份热爱来到苏黎世,加入了我们的研究小组攻读他的博士学位。埃万德罗曾经有过研究蛋白质的经验,他能熟练地从巨大的蛋白质数据库中筛选出所需的信息,不论是蛋白质的折叠方式还是蛋白质分子内的原子信息。埃万德罗个性安静,常常陷入沉思,这种个性我以前在别人身上见过,这些人常常与生命的深层奥秘缠斗。也许这也是他同意研究这个问题的原因,因为蛋白质的空间结构正是这样的奥秘:挑战性强,意义深远,异常艰难,但也不是没有被解决的可能。另外,蛋白质的空间结构里还隐藏着蛋白质进化的秘密。
1700255314
1700255315
埃万德罗重点研究的是酶,因为这类蛋白质的种类异常丰富。这毫不意外,因为酶需要催化5 000多种不同的化学反应。科学家已经对酶进行过深入研究:他们已经把蛋白质图书馆中散落的几千种蛋白质标记了出来。一旦我们知道了酶的精确位置,就可以用计算机进行分析。埃万德罗利用电脑选出一对蛋白质,它们的折叠方式相同,但在基因型网络中处于不同位置。紧接着,他检验了第一个蛋白质所在社区的一小部分相邻蛋白,列出了其中所有已知的蛋白质和它们的功能。之后,他以相同的方式检验了第二个蛋白质所在的社区,列出了经过检验的所有已知蛋白质和它们的功能。他比较了两张列表,关注点集中在两个列表中的蛋白质是否相同,以及两个社区的蛋白质功能是否相同。然后他选取了另一对蛋白质,重复相同的检验过程,关注相同的问题,直到他研究了几百对蛋白质和它们所在的社区。
1700255316
1700255317
最终的答案很简单:即使两个蛋白质在图书馆里离得很近,它们的社区内包含的大部分蛋白质功能也不同。比如,某两个蛋白质中存在差异的氨基酸只有不到20%,即便如此,它们各自所在社区里的蛋白质的大部分功能也都不同。蛋白质图书馆和代谢图书馆一样,社区高度多样化。出于同样的原因,这种多样性使得庞大的基因型网络与探索蛋白质图书馆的过程相适应,蛋白分子在保存原有意义的同时,拥有进化成为功能不同的新蛋白质的巨大潜力。
1700255318
1700255319
代谢图书馆和蛋白质图书馆中充斥着基因型网络,这些网络由含义相同的文本构成,每个文本都被放置在高维空间的超几何体上,两个图书馆里的多样性社区数量也都多得难以想象。它们彼此间有诸多相似之处,但都与人类图书馆大相径庭。不过这也没什么好奇怪的,因为远在人类出现之前,它们就已经存在了。
1700255320
1700255321
1700255322
1700255323
1700255324
确切一点说,代谢图书馆和蛋白质图书馆的出现至少比人类早了30亿年。从那时候起,蛋白质就从RNA手里接管了大部分生命的工作。这样做绝对有着充分的理由,因为蛋白质的构件要多得多,RNA只有4种核苷酸,相比之下蛋白质则有20个不同的氨基酸,大自然可以用蛋白质书写更多不同的文本。要写一条10个字母长的链,用4个字母的字母表大约可以写出100万条,而用20个字母的字母表则可以写出超过10万亿条,后者是前者的1 000万倍。相比RNA,蛋白质文本的数量要多得多,而且文本越长,两者的差异越明显。更多的文本意味着更多的构型,参与更多的反应催化,执行更多的功能和完成更多的任务。
1700255325
1700255326
但RNA的出现确实先于蛋白质,就凭这一点,RNA就足以在生物进化的万神殿里享有一席之地。如果没有历史上的第一个自我复制分子以及它的进化,也就没有今天的我们。不理解这种进化的过程,我们的工作也就不能算是完整的。
1700255327
1700255328
幸好,RNA和蛋白质之间有许多相似之处,这有助于我们理解RNA的进化。我们可以把RNA文本组织成一座超立方体图书馆,虽然不如蛋白质图书馆大,但依然规模惊人。在图书馆中,相似的文本离得近,相异的文本离得远。这座图书馆也属于高纬建筑,这意味着其中的社区比三维空间里的大得多,即一个文本附近有许多其他文本。由于RNA长链分子和蛋白质一样高度灵活,所以许多RNA文本的意义也会借助构型语言来表达。和蛋白质一样,RNA链也会在空间中弯曲扭转,精心折叠。
1700255329
1700255330
不幸的是,RNA与蛋白质的相似之处仅到此为止。RNA分子似乎不愿意轻易显山露水,对它的构型研究一直不顺利。科学家们至今只确认了数百个RNA构型,而我们已经知道了上千种蛋白质的构型和功能,相比之下,已知的RNA构型数量简直微不足道。我们在蛋白质中取得的成果,即大量比较自然界中的蛋白分子并绘出图书馆模型,暂时还不可能在RNA分子上重复。
1700255331
1700255332
尽管如此,得益于奥地利科学家彼得·舒斯特(Peter Schuster)和他的同事们的工作,RNA图书馆的建设并不是毫无进展。舒斯特是欧洲计算生物学的鼻祖之一,他从20世纪70年代起就在维也纳大学担任教职,现在是该大学的退休教授。我与舒斯特的第一次会面似乎印证了许多欧洲人对奥地利人的固有印象。舒斯特个性活泼,块头很大,幽默感奇特,哪怕出现在奥匈帝国晚期的传统维也纳咖啡馆也毫不突兀,因为那样的地方往往聚集了大量受过良好教育的饱学之士,从心理分析到量子理论,他们对每件事都能滔滔不绝。舒斯特正是那种传统的科学家,一个纯粹的知识分子,对各种话题都能信手拈来。他不摆架子,说话风趣,就算谈话内容再严肃也会找机会岔开话题幽默一把。有句耳熟能详的谚语阐释了奥地利人对生活本身和生活中诸多挑战的看法:“情况不容乐观,但是绝望为时尚早。”舒斯特本人就是这句谚语的写照。
1700255333
1700255334
舒斯特看起来大大咧咧,但思维开阔、头脑清晰。他是提出RNA世界起源理论的先驱之一,他的研究小组开发的计算机程序成功预测了RNA一个重要的分子特性,即它具有二级结构。
1700255335
1700255336
当RNA单链进行折叠时,首先出现的正是它的二级结构。随着RNA链扭转、弯曲、缠卷,部分核苷酸互相配对,在分子内形成局部的双螺旋区段,像极了著名的DNA双螺旋。众多双螺旋与它们之间的单链区域,就构成了RNA的二级结构,而所有这些结构都是由一条RNA长链通过自身折叠形成的。RNA的二级结构就像蛋白质的α-螺旋和β-折叠,二级螺旋结构通过自组织形式,向更高级的立体结构自发发展。
1700255337
1700255338
舒斯特能通过核苷酸序列计算出RNA的二级结构,不仅如此,他们小组的计算机程序运行得飞快,几秒内就能预测出几百种分子构型。而对于更加复杂的RNA三维结构,我们至今都无法做到快速运算。有了如此高效的程序,我们就可以开始绘制RNA图书馆的地图了。即使我们离完全理解RNA的折叠方式和功能还有很长一段路要走,二级结构本身已经足够关键了:如果一个RNA分子的核苷酸顺序发生变异,破坏了它的二级结构,这个分子就不能进行正确的三维折叠。二级结构对RNA分子的意义至关重要,正如花束不能跳过一朵花凭空出现,RNA分子的三级结构也无法逾越二级结构存在。这个理由充分论证了研究二级结构的必要性。
1700255339
1700255340
舒斯特身边的研究人员在RNA图书馆中发现了许多可以解读的分子含义,令人眼花缭乱,而所有分子含义都可以通过RNA构型进行表达。举例来说,对于一个含有100个核苷酸的RNA,它的不同构型的可能数量已经达到了1023种。许多天然RNA分子包含的核苷酸更多,更长的RNA链则相应拥有更多的可能构型。
1700255341
1700255342
另外,构型相同的文本在RNA图书馆中的组织方式和蛋白质图书馆非常相似,即文本连成网络,延伸至图书馆深处,你可以通过微小的改变积累,逐步修改,直到彻底改变一个文本的内容,同时保持文本编码的RNA功能不变。像蛋白质图书馆一样,RNA图书馆中不同的社区更像中世纪的村庄那样多姿多彩,而不像城里的社区那样大同小异。每个社区里的构型都不尽相同,任意两个不同的社区之间的交集也廖廖无几。这一切都意味着RNA进化所遵循的规则与蛋白质相同,而最新的实验表明事实的确如此。
[
上一页 ]
[ :1.700255293e+09 ]
[
下一页 ]