1700255206
可见,微小的变化同样能够对生命造成巨大影响,中亚的斑头雁也是一个例证。斑头雁是世界上飞得最高的鸟类之一。它必须飞得足够高,因为它的迁徙路线需要途经珠穆朗玛峰,那里的海拔超过8 000米。在这个高度上,周围的空气非常稀薄,鸟儿必须更加拼命地拍打翅膀,而且那里的氧气含量仅为海平面的1/3。攀登珠穆朗玛峰的登山者在到达这一海拔时往往需要借助氧气罐,而乘坐喷气式飞机的乘客则需要加压舱的保护。大雁无法借助这两者中的任何一项技术,但是没关系,它有更好的办法。斑头雁体内的血红蛋白在氨基酸序列上发生了变异,这种蛋白质负责将氧气从肺输送到肌肉。与我们体内的血红蛋白相比,斑头雁体内的血红蛋白和氧气结合更紧密。斑头雁能从稀薄的空气中摄入氧气分子,在别的鸟类不得不因为过高的海拔着陆时,斑头雁却能继续飞行。
1700255207
1700255208
北极鳕鱼体内的抗冻蛋白和斑头雁体内的氧合血红蛋白,都是弥足珍贵的进化产物。它们拓展了生物的活动范围,而更大的栖息地则意味着更多的食物、更高的生存概率以及更多的后代。还有一些进化的优势成果与这些改良的分子略有差异,比如区别一种食物与另一种食物的能力,比如晚餐选择有营养的而不是有毒植物的能力。这些性状优化的是生物的知觉,而不是它们的机动性。人类眼球后方的视网膜里含有三种视蛋白,这三种视蛋白在感光和适应不同波长的能力上高度特异化。多亏有它们,我们才能看见色彩斑斓的世界。但这一切并不是从生命出现之初就与生俱来的。
1700255209
1700255210
我们最古老的脊椎动物先祖可能只拥有一种视蛋白,它们眼里的世界是黑白的。大多数哺乳动物有两种不同的视蛋白:视红蛋白和视蓝蛋白,它们能看到的世界主要基于这两种不同的颜色。但我们和黑猩猩等近亲则能够看到基于三种原色的世界,也许这是因为色觉有助于我们的祖先觅食:在绿叶的衬托下,水果往往更加显眼。当然,不管什么原因,色觉进化所需的变化很少,少到只要改变三个氨基酸就能把视红蛋白变成视绿蛋白。
1700255211
1700255212
色觉进化等改变对我们往往是有益的,但也有一些进化对我们是有害的,例如某些细菌进化出的对医生开出的抗生素产生耐药性的能力。尽管我们不断地改进着抗生素,但是耐药性却始终不可避免,这是一场发生在细菌与生物技术专家之间的军备竞赛。这场竞赛让人想起刘易斯·卡罗尔(Lewis Carroll)在《爱丽丝镜中奇遇记》(Through the Looking-Glass, and What Alice Found There)中描写的红皇后,她曾对爱丽丝说过这样一句广为人知的话:“你瞧,在我们这儿得拼命地跑,才能保持在原地。”细菌在这场竞赛中找到了各种各样的新蛋白,有些蛋白质能够破坏抗生素分子,另一些则被称为“外排泵”,它们能把抗生素强行排出细胞,就像一支细菌救援小队把有毒气体排出被污染的房子。
1700255213
1700255214
基因转移加上频繁的人口流动可以在几个月之内把这些优良的性状带到世界的每个角落。还有一些蛋白质尤为阴险,它们负责排出的抗生素不止一种,如此一来,细菌就同时对多种抗生素产生了耐药性。说来奇怪,如果我们自己身体里的细胞失控,疯狂繁殖时也常常利用相似的外排泵对抗它们厌恶的抗癌药物。这不仅仅是癌细胞和细菌在面对危险时的英雄所见略同,同时它也是我们在对抗癌症的战斗中屡战屡败的原因。
1700255215
1700255216
生物进化中出现的外排泵并非无中生有,而是对已有运输蛋白进行修饰的产物。运输蛋白对维持细胞的日常运作与生存至关重要,因为它们不停地将成千上万的分子(养分、废物、建筑材料)送往细胞内的不同目的地。那么我们真的应该称之为新蛋白吗?同样的疑问也存在于斑头雁体内的改良血红蛋白和灵长类体内的感光细胞中。大自然不过只是胡乱摆弄了几下原有的血红蛋白,让它和氧气结合得更紧密;或者胡乱修改了一下视蛋白,调整了它的色觉灵敏谱而已,两者都算不上是严格意义上的“新”蛋白。
1700255217
1700255218
不过,如果你试想一下这些变化带来的影响:一只可以穿越任何山脉的鸟迎来了几百万平方公里的新栖息地;我们看到的世界是黑白的该有多无趣;耐药或者不耐药对细菌而言意味着生死之别。单就差异巨大的结果而言,这些小小的变化就足以被称为新性状。上述的例子无不说明,只要稍微改变几个原子就可以影响比原子大几百万倍的生物,并永远改变这个生物后代的命运。
1700255219
1700255220
1700255221
1700255222
1700255223
我们在第3章里看到,通过基因水平转移重组代谢酶,大自然不断更新着生物体内的生化反应。即便如此,代谢酶自身也并不是这样形成的。从上述最后举的几个例子中我们可以看出,大自然会通过改变已有蛋白质的氨基酸序列创造新的蛋白质,我们已知的5 000多种酶中的每一种都是按照这种方式被创造出来的。此外,还有不胜枚举的蛋白质在我们体内负责调节基因、输送物质、收缩肌肉、运输氧气、输入养分、排泄废物、在细胞间传递信息以及承担其他无数种任务。蛋白质多样的功能足够我们写上整整一本书。事实上已经有这样的书了,这种专业的书对某些蛋白质的记述非常完备,事无巨细。
1700255224
1700255225
但这本书不属此类。
1700255226
1700255227
你无法只是通过道听途说就了解有一种蛋白质叫抗冻蛋白,还有一种叫视蛋白,以及理解这些蛋白质起源的真相,就像你没法只靠几个国家的卫星图像就画出一张完整的美国地图。要解释新蛋白质的起源需要我们拿它们与大量原始蛋白质进行比较,成百上千对地进行比较。
1700255228
1700255229
如果能解读基因的DNA或者基因编码的氨基酸链,也就是蛋白质的基因型,这个任务就会容易一些。对两者进行解读的先驱之一是英国生物化学家弗雷德里克·桑格(Frederick Sanger)。他是极少数得过两次诺贝尔奖的科学家之一,第一次是因为他成功破译了胰岛素的氨基酸序列,而第二次则是表彰他成功完成了对DNA的碱基测序。在距离他做出卓越贡献的几十年后,我们才终于掌握了解读代谢基因型的技术,才认识了更多蛋白质的基因型和表现型。这些基因型和表现型来自各种生物,所处环境各异:北极圈荒原、热带丛林、山麓、深海、人体内脏、滚烫的温泉、贫瘠的荒漠、肥沃的平原、肮脏的水沟和清澈的河渠。
1700255230
1700255231
这么大一堆关于蛋白质的事实如果不经组织,简直就是一本疯子编纂的字典,里面的几百万个单词杂乱无章,毫无头绪可言。然而一旦经过组织,这些事实就成了图书馆的一部分,这个图书馆和第3章中巨大的代谢图书馆类似。这个宇宙图书馆里收录的正是蛋白质的基因型,每个文本都由20个字母构成的字母表写就,每个字母对应一个氨基酸。这座图书馆收集了生命已经创造和能够创造的所有蛋白质,有时也被称为蛋白质空间(protein space)或序列空间(sequence space)——因为每个文本都对应一个唯一的氨基酸序列。
1700255232
1700255233
通过与前面章节类似的计算方式,我们大概已经可以预见,这个图书馆的规模和代谢图书馆一样惊人。回想一下,20种可能的氨基酸,两个字母可以构成的文本就有400(202)种。同理,3个氨基酸构成的可能文本有8 000(203)种,4个氨基酸对应于16万(204)种文本,以此类推。像这样的短文本充其量只能叫肽,大多数蛋白质包含的文本要长得多,即多肽,它的可能文本数量随着长度增加呈爆炸式增长,即便是仅由100个氨基酸构成的蛋白质,可能的文本数量也已经超过了10130种。这个数字大得难以想象,但是蛋白质图书馆内的馆藏数量比这还大,因为像蔗糖酶这样的蛋白质含有1 000多个氨基酸,而有些人类蛋白质比蔗糖酶还要再长许多倍。其中有一个庞然大物叫肌联蛋白(titin),含3万个氨基酸,是肌肉的弹性成分。由此可见,蛋白质图书馆的规模同样是超宇宙常数级别的。
1700255234
1700255235
蛋白质图书馆和代谢图书馆的相似之处不仅在于规模。和后者一样,蛋白质图书馆也是一个超几何体,相似的文本彼此邻近。每个蛋白质文本位于这个超立方体的一个顶点,就像在代谢图书馆里一样,每个蛋白质都有许多直接相邻的邻居,这些邻居和它只差一个字母,位于超立方体上相邻的顶点。
1700255236
1700255237
我们以一个含有100个氨基酸的蛋白质分子为例,如果你想改变蛋白质的第一个氨基酸,那么就有19个选项,这也就意味着与这个蛋白质只差第一个氨基酸的蛋白质邻居有19个。按照同样的思路,这个蛋白质有19个与其第2个氨基酸不同的邻居,19个与其第3个氨基酸不同的邻居,19个与第4个……19个与其第100个氨基酸不同的邻居。一句话,我们的蛋白质有1 900个直接邻居。这样一个社区已经很庞大了,但如果你改变的不是一个氨基酸,而是两个或更多,那么这个社区还会更大。显然,对进化来说这不是坏事:只要简单改变一个或几个氨基酸,就可以产生许多新的蛋白质。
1700255238
1700255239
在这座图书馆迷宫里漫游,要是手里没有一团展开的毛线丈量走过的路程,很容易就会迷路,这一点也和代谢图书馆类似。在这里我们也需要借助某种方式来衡量蛋白质图书馆里的“距离”,于是我们采用了两个蛋白质相异的氨基酸数目作为衡量距离的单位。这个标准可以告诉你,从一个蛋白质文本到任一其他文本要走多远,即需要改变多少个氨基酸。
1700255240
1700255241
图书馆中的文本很重要,但更重要的是每个文本承载的意义。我们的双眼无法解读这种意义,无法阅读蛋白质化学语言的单词、句子和段落,但生命自身精通这门语言,并能分辨出一个蛋白质文本到底是文风优美的佳作,还是词不达意的垃圾。
1700255242
1700255243
细胞判断蛋白质是否有意义的标准很实际:能让细胞存活的蛋白质就有意义。只有有用的蛋白质才有意义,有缺陷的变异蛋白不能正确完成折叠,自然也就一无是处。如果“意义”这个词听起来过于以人类为中心,我们不妨参考一下符号学——一门语言学的分支,主要研究意义的意义,其中对“意义”的定义是任何符号(随便什么东西,可以是路标,可以是一本书)所指涉的内容。根据这个定义,如果蛋白质的基因是符号,那么它所编码的蛋白质氨基酸序列以及蛋白质在细胞内所起的作用就是它的意义。
1700255244
1700255245
宇宙图书馆里到底确切地藏有多少本有意义的书,我们仍然无从得知。但经过几十年的研究,如今我们已经可以估算蛋白质图书馆里有意义的蛋白质的数量,因为大多数有用的蛋白质都有特定的折叠形状。从图书馆里随机选取一个书架,随机选取一个蛋白质,它能够折叠的概率至少是万分之一。这个概率听起来好像不是很大,但请记得,宇宙图书馆本身非常巨大,光是由100个氨基酸组成的蛋白质就超过10130个。即使其中只有万分之一的蛋白质能够折叠,也有10126个,即1后面跟着126个0,这比全宇宙中的氢原子数量还多。由此可知,有意义的蛋白质的数目大得超乎想象。
1700255246
1700255247
1700255248
1700255249
1700255250
进化会利用大量的生物体对蛋白质图书馆进行探索。DNA一代接一代地复制,难免会出现复制错误,改变DNA链上的碱基,如腺嘌呤变成胞嘧啶,胸腺嘧啶变成鸟嘌呤,或者发生其他变化,每改变一个氨基酸,蛋白质就会发生改变。变化后的文本可能具有全新的用途,想要理解这一过程,我们就得绘制蛋白质图书馆的地图,就像在代谢图书馆中做过的那样。这个任务没有看上去那么难:多亏研究蛋白质的科学家们在过去数十年中的不懈努力,我们已经知道了成千上万种蛋白质的折叠方式、功能以及在图书馆中的位置。另外,借助20世纪的分子生物学技术,我们可以从书架上取下任意一卷书,合成相应的蛋白质,并在实验室里研究它的折叠方式和功能。
1700255251
1700255252
有关蛋白质进化中的一个最简单的问题,我们在之前的章节中已经探讨过了。要找到一个有一丁点意义、有助于生物体存活的蛋白质有多难呢?如果图书馆里只有一个这样的蛋白质,即便从遥远的大爆炸开始找也很难找到。既然存在大量有意义的蛋白质,那么生命在面对不同的挑战时,就会有多种解决方式,但到底有多少种呢?
1700255253
1700255254
2001年,哈佛大学的安东尼·基夫(Anthony Keefe)和杰克·绍斯塔克(Jack Szostak)试图回答这个问题,他们研究的蛋白质家族的重要性不亚于生命历史中出现的任何其他性状:这类蛋白质可以联结三磷酸腺苷,而我们已经在第2章中说过,三磷酸腺苷是生命的电池。一般情况下,蛋白质通过裂解三磷酸腺苷摄取工作时所需的能量,包括运输材料、收缩肌肉、构建新分子等。
1700255255
[
上一页 ]
[ :1.700255206e+09 ]
[
下一页 ]