1700255193
1700255194
图4-1 完成空间折叠后的蔗糖酶
1700255195
1700255196
虽然图4-1中的折叠看起来很像一团乱糟糟的意大利面,不过这种折叠方式实际上是高度有序的:任何一个蔗糖酶中的两条氨基酸链折叠的方式都是自发完成的,且折叠的产物完全一致。构型对于保证蛋白质的功能至关重要:热能导致折叠的蛋白质分子不断振动和振荡,而α-螺旋和β-折叠则起到引导并限制分子热运动的作用。振动受限让蔗糖酶这样的酶能够催化糖的裂解反应,原理有点像剪刀:如果没有连接刀片的转轴限制它们的运动,剪刀也就无法裁纸。鉴于热运动对酶分子的重要性,所以对每种酶分子的催化作用而言,都存在一个最适的理想温度:热量太低,分子振动微弱,不足以组织分子运动;热量太高,剧烈振动则会使空间折叠分崩离析,导致蛋白质变回线型氨基酸链。更糟的是,未折叠的蛋白质经常聚合成大团大团的惰性物质,就像熟鸡蛋里的蛋白。未折叠的成团蛋白质不仅无用,而且有害。就像如果你的大脑里积累了太多蛋白质块,就会引起严重疾病,例如阿尔茨海默氏症。
1700255197
1700255198
蔗糖酶和其他蛋白质在振荡中形成的构型复杂多样,且各自都有着特定的功能。每种蛋白质的构型都高度复杂,与它们所执行的功能相适应。用达尔文描述生命世界的话来说,这是一个“无尽之形最美”(endless forms most beautiful)的世界。蛋白质的构型维持着生命世界的运转。
1700255199
1700255200
蛋白质不仅需要处理眼下的工作和任务。如同人类的经济社会一样,生物也需要面对瞬息万变的挑战。作为应对,进化为生命带来了新的蛋白质构型,而具有新构型的蛋白质则可以承担新的工作。每当生命需要解决新问题时,比如在极度低温的环境中,体内生长的冰晶变成致命的刀片,威胁到自身的生存时,新的招募工作就开始了。
1700255201
1700255202
无论是早先的高炉,还是如今的智能手机,人类社会中的发明往往需要经历漫长的独立研发过程,并非一蹴而就。与之类似,自然界塑造生物新性状的过程也往往不是瞬间实现的。抗冻蛋白就是一个例子,不只是北极鳕鱼体内有抗冻蛋白,南极鱼类也有,但是两者的抗冻蛋白分别起源于不同祖先体内的两种蛋白质。抗冻蛋白甚至有过不止一次起源,不仅如此,有些鱼类还进化出了不止一种抗冻蛋白。美洲拟鲽是北大西洋的一种比目鱼,它的体内能够合成两种抗冻蛋白,一种防止血液结冰,另一种防止皮肤结冰。以进化的角度来衡量,有些蛋白质的出现着实非常迅速,只用了不到300万年的时间。
1700255203
1700255204
某些早期生物对冻伤非常敏感,它们体内的蛋白质与抗冻蛋白的氨基酸序列往往相去甚远,不过蛋白质进化所需的变化通常比我们想象的要少得多。只要改变一个氨基酸,合成组胺酸的酶就会变成功能不同的另一种酶,合成的产物也变成了色氨酸。大肠杆菌的一种酶能催化并从阿拉伯糖[16]中摄取能量,改变这种酶中的一个特定的氨基酸,它的功能就从转移酶变成了裂解酶。
1700255205
1700255206
可见,微小的变化同样能够对生命造成巨大影响,中亚的斑头雁也是一个例证。斑头雁是世界上飞得最高的鸟类之一。它必须飞得足够高,因为它的迁徙路线需要途经珠穆朗玛峰,那里的海拔超过8 000米。在这个高度上,周围的空气非常稀薄,鸟儿必须更加拼命地拍打翅膀,而且那里的氧气含量仅为海平面的1/3。攀登珠穆朗玛峰的登山者在到达这一海拔时往往需要借助氧气罐,而乘坐喷气式飞机的乘客则需要加压舱的保护。大雁无法借助这两者中的任何一项技术,但是没关系,它有更好的办法。斑头雁体内的血红蛋白在氨基酸序列上发生了变异,这种蛋白质负责将氧气从肺输送到肌肉。与我们体内的血红蛋白相比,斑头雁体内的血红蛋白和氧气结合更紧密。斑头雁能从稀薄的空气中摄入氧气分子,在别的鸟类不得不因为过高的海拔着陆时,斑头雁却能继续飞行。
1700255207
1700255208
北极鳕鱼体内的抗冻蛋白和斑头雁体内的氧合血红蛋白,都是弥足珍贵的进化产物。它们拓展了生物的活动范围,而更大的栖息地则意味着更多的食物、更高的生存概率以及更多的后代。还有一些进化的优势成果与这些改良的分子略有差异,比如区别一种食物与另一种食物的能力,比如晚餐选择有营养的而不是有毒植物的能力。这些性状优化的是生物的知觉,而不是它们的机动性。人类眼球后方的视网膜里含有三种视蛋白,这三种视蛋白在感光和适应不同波长的能力上高度特异化。多亏有它们,我们才能看见色彩斑斓的世界。但这一切并不是从生命出现之初就与生俱来的。
1700255209
1700255210
我们最古老的脊椎动物先祖可能只拥有一种视蛋白,它们眼里的世界是黑白的。大多数哺乳动物有两种不同的视蛋白:视红蛋白和视蓝蛋白,它们能看到的世界主要基于这两种不同的颜色。但我们和黑猩猩等近亲则能够看到基于三种原色的世界,也许这是因为色觉有助于我们的祖先觅食:在绿叶的衬托下,水果往往更加显眼。当然,不管什么原因,色觉进化所需的变化很少,少到只要改变三个氨基酸就能把视红蛋白变成视绿蛋白。
1700255211
1700255212
色觉进化等改变对我们往往是有益的,但也有一些进化对我们是有害的,例如某些细菌进化出的对医生开出的抗生素产生耐药性的能力。尽管我们不断地改进着抗生素,但是耐药性却始终不可避免,这是一场发生在细菌与生物技术专家之间的军备竞赛。这场竞赛让人想起刘易斯·卡罗尔(Lewis Carroll)在《爱丽丝镜中奇遇记》(Through the Looking-Glass, and What Alice Found There)中描写的红皇后,她曾对爱丽丝说过这样一句广为人知的话:“你瞧,在我们这儿得拼命地跑,才能保持在原地。”细菌在这场竞赛中找到了各种各样的新蛋白,有些蛋白质能够破坏抗生素分子,另一些则被称为“外排泵”,它们能把抗生素强行排出细胞,就像一支细菌救援小队把有毒气体排出被污染的房子。
1700255213
1700255214
基因转移加上频繁的人口流动可以在几个月之内把这些优良的性状带到世界的每个角落。还有一些蛋白质尤为阴险,它们负责排出的抗生素不止一种,如此一来,细菌就同时对多种抗生素产生了耐药性。说来奇怪,如果我们自己身体里的细胞失控,疯狂繁殖时也常常利用相似的外排泵对抗它们厌恶的抗癌药物。这不仅仅是癌细胞和细菌在面对危险时的英雄所见略同,同时它也是我们在对抗癌症的战斗中屡战屡败的原因。
1700255215
1700255216
生物进化中出现的外排泵并非无中生有,而是对已有运输蛋白进行修饰的产物。运输蛋白对维持细胞的日常运作与生存至关重要,因为它们不停地将成千上万的分子(养分、废物、建筑材料)送往细胞内的不同目的地。那么我们真的应该称之为新蛋白吗?同样的疑问也存在于斑头雁体内的改良血红蛋白和灵长类体内的感光细胞中。大自然不过只是胡乱摆弄了几下原有的血红蛋白,让它和氧气结合得更紧密;或者胡乱修改了一下视蛋白,调整了它的色觉灵敏谱而已,两者都算不上是严格意义上的“新”蛋白。
1700255217
1700255218
不过,如果你试想一下这些变化带来的影响:一只可以穿越任何山脉的鸟迎来了几百万平方公里的新栖息地;我们看到的世界是黑白的该有多无趣;耐药或者不耐药对细菌而言意味着生死之别。单就差异巨大的结果而言,这些小小的变化就足以被称为新性状。上述的例子无不说明,只要稍微改变几个原子就可以影响比原子大几百万倍的生物,并永远改变这个生物后代的命运。
1700255219
1700255220
1700255221
1700255222
1700255223
我们在第3章里看到,通过基因水平转移重组代谢酶,大自然不断更新着生物体内的生化反应。即便如此,代谢酶自身也并不是这样形成的。从上述最后举的几个例子中我们可以看出,大自然会通过改变已有蛋白质的氨基酸序列创造新的蛋白质,我们已知的5 000多种酶中的每一种都是按照这种方式被创造出来的。此外,还有不胜枚举的蛋白质在我们体内负责调节基因、输送物质、收缩肌肉、运输氧气、输入养分、排泄废物、在细胞间传递信息以及承担其他无数种任务。蛋白质多样的功能足够我们写上整整一本书。事实上已经有这样的书了,这种专业的书对某些蛋白质的记述非常完备,事无巨细。
1700255224
1700255225
但这本书不属此类。
1700255226
1700255227
你无法只是通过道听途说就了解有一种蛋白质叫抗冻蛋白,还有一种叫视蛋白,以及理解这些蛋白质起源的真相,就像你没法只靠几个国家的卫星图像就画出一张完整的美国地图。要解释新蛋白质的起源需要我们拿它们与大量原始蛋白质进行比较,成百上千对地进行比较。
1700255228
1700255229
如果能解读基因的DNA或者基因编码的氨基酸链,也就是蛋白质的基因型,这个任务就会容易一些。对两者进行解读的先驱之一是英国生物化学家弗雷德里克·桑格(Frederick Sanger)。他是极少数得过两次诺贝尔奖的科学家之一,第一次是因为他成功破译了胰岛素的氨基酸序列,而第二次则是表彰他成功完成了对DNA的碱基测序。在距离他做出卓越贡献的几十年后,我们才终于掌握了解读代谢基因型的技术,才认识了更多蛋白质的基因型和表现型。这些基因型和表现型来自各种生物,所处环境各异:北极圈荒原、热带丛林、山麓、深海、人体内脏、滚烫的温泉、贫瘠的荒漠、肥沃的平原、肮脏的水沟和清澈的河渠。
1700255230
1700255231
这么大一堆关于蛋白质的事实如果不经组织,简直就是一本疯子编纂的字典,里面的几百万个单词杂乱无章,毫无头绪可言。然而一旦经过组织,这些事实就成了图书馆的一部分,这个图书馆和第3章中巨大的代谢图书馆类似。这个宇宙图书馆里收录的正是蛋白质的基因型,每个文本都由20个字母构成的字母表写就,每个字母对应一个氨基酸。这座图书馆收集了生命已经创造和能够创造的所有蛋白质,有时也被称为蛋白质空间(protein space)或序列空间(sequence space)——因为每个文本都对应一个唯一的氨基酸序列。
1700255232
1700255233
通过与前面章节类似的计算方式,我们大概已经可以预见,这个图书馆的规模和代谢图书馆一样惊人。回想一下,20种可能的氨基酸,两个字母可以构成的文本就有400(202)种。同理,3个氨基酸构成的可能文本有8 000(203)种,4个氨基酸对应于16万(204)种文本,以此类推。像这样的短文本充其量只能叫肽,大多数蛋白质包含的文本要长得多,即多肽,它的可能文本数量随着长度增加呈爆炸式增长,即便是仅由100个氨基酸构成的蛋白质,可能的文本数量也已经超过了10130种。这个数字大得难以想象,但是蛋白质图书馆内的馆藏数量比这还大,因为像蔗糖酶这样的蛋白质含有1 000多个氨基酸,而有些人类蛋白质比蔗糖酶还要再长许多倍。其中有一个庞然大物叫肌联蛋白(titin),含3万个氨基酸,是肌肉的弹性成分。由此可见,蛋白质图书馆的规模同样是超宇宙常数级别的。
1700255234
1700255235
蛋白质图书馆和代谢图书馆的相似之处不仅在于规模。和后者一样,蛋白质图书馆也是一个超几何体,相似的文本彼此邻近。每个蛋白质文本位于这个超立方体的一个顶点,就像在代谢图书馆里一样,每个蛋白质都有许多直接相邻的邻居,这些邻居和它只差一个字母,位于超立方体上相邻的顶点。
1700255236
1700255237
我们以一个含有100个氨基酸的蛋白质分子为例,如果你想改变蛋白质的第一个氨基酸,那么就有19个选项,这也就意味着与这个蛋白质只差第一个氨基酸的蛋白质邻居有19个。按照同样的思路,这个蛋白质有19个与其第2个氨基酸不同的邻居,19个与其第3个氨基酸不同的邻居,19个与第4个……19个与其第100个氨基酸不同的邻居。一句话,我们的蛋白质有1 900个直接邻居。这样一个社区已经很庞大了,但如果你改变的不是一个氨基酸,而是两个或更多,那么这个社区还会更大。显然,对进化来说这不是坏事:只要简单改变一个或几个氨基酸,就可以产生许多新的蛋白质。
1700255238
1700255239
在这座图书馆迷宫里漫游,要是手里没有一团展开的毛线丈量走过的路程,很容易就会迷路,这一点也和代谢图书馆类似。在这里我们也需要借助某种方式来衡量蛋白质图书馆里的“距离”,于是我们采用了两个蛋白质相异的氨基酸数目作为衡量距离的单位。这个标准可以告诉你,从一个蛋白质文本到任一其他文本要走多远,即需要改变多少个氨基酸。
1700255240
1700255241
图书馆中的文本很重要,但更重要的是每个文本承载的意义。我们的双眼无法解读这种意义,无法阅读蛋白质化学语言的单词、句子和段落,但生命自身精通这门语言,并能分辨出一个蛋白质文本到底是文风优美的佳作,还是词不达意的垃圾。
1700255242
[
上一页 ]
[ :1.700255193e+09 ]
[
下一页 ]