打字猴:1.700255243e+09
1700255243 细胞判断蛋白质是否有意义的标准很实际:能让细胞存活的蛋白质就有意义。只有有用的蛋白质才有意义,有缺陷的变异蛋白不能正确完成折叠,自然也就一无是处。如果“意义”这个词听起来过于以人类为中心,我们不妨参考一下符号学——一门语言学的分支,主要研究意义的意义,其中对“意义”的定义是任何符号(随便什么东西,可以是路标,可以是一本书)所指涉的内容。根据这个定义,如果蛋白质的基因是符号,那么它所编码的蛋白质氨基酸序列以及蛋白质在细胞内所起的作用就是它的意义。
1700255244
1700255245 宇宙图书馆里到底确切地藏有多少本有意义的书,我们仍然无从得知。但经过几十年的研究,如今我们已经可以估算蛋白质图书馆里有意义的蛋白质的数量,因为大多数有用的蛋白质都有特定的折叠形状。从图书馆里随机选取一个书架,随机选取一个蛋白质,它能够折叠的概率至少是万分之一。这个概率听起来好像不是很大,但请记得,宇宙图书馆本身非常巨大,光是由100个氨基酸组成的蛋白质就超过10130个。即使其中只有万分之一的蛋白质能够折叠,也有10126个,即1后面跟着126个0,这比全宇宙中的氢原子数量还多。由此可知,有意义的蛋白质的数目大得超乎想象。
1700255246
1700255247
1700255248
1700255249
1700255250 进化会利用大量的生物体对蛋白质图书馆进行探索。DNA一代接一代地复制,难免会出现复制错误,改变DNA链上的碱基,如腺嘌呤变成胞嘧啶,胸腺嘧啶变成鸟嘌呤,或者发生其他变化,每改变一个氨基酸,蛋白质就会发生改变。变化后的文本可能具有全新的用途,想要理解这一过程,我们就得绘制蛋白质图书馆的地图,就像在代谢图书馆中做过的那样。这个任务没有看上去那么难:多亏研究蛋白质的科学家们在过去数十年中的不懈努力,我们已经知道了成千上万种蛋白质的折叠方式、功能以及在图书馆中的位置。另外,借助20世纪的分子生物学技术,我们可以从书架上取下任意一卷书,合成相应的蛋白质,并在实验室里研究它的折叠方式和功能。
1700255251
1700255252 有关蛋白质进化中的一个最简单的问题,我们在之前的章节中已经探讨过了。要找到一个有一丁点意义、有助于生物体存活的蛋白质有多难呢?如果图书馆里只有一个这样的蛋白质,即便从遥远的大爆炸开始找也很难找到。既然存在大量有意义的蛋白质,那么生命在面对不同的挑战时,就会有多种解决方式,但到底有多少种呢?
1700255253
1700255254 2001年,哈佛大学的安东尼·基夫(Anthony Keefe)和杰克·绍斯塔克(Jack Szostak)试图回答这个问题,他们研究的蛋白质家族的重要性不亚于生命历史中出现的任何其他性状:这类蛋白质可以联结三磷酸腺苷,而我们已经在第2章中说过,三磷酸腺苷是生命的电池。一般情况下,蛋白质通过裂解三磷酸腺苷摄取工作时所需的能量,包括运输材料、收缩肌肉、构建新分子等。
1700255255
1700255256 想要释放和利用三磷酸腺苷的能量,蛋白质首先要结合三磷酸腺苷。如果庞大的蛋白质图书馆里只有一种蛋白质能够结合三磷酸腺苷,盲目寻找不过是在白费力气,想找到它除非有奇迹出现。基夫和绍斯塔克想弄清楚,图书馆里能够结合三磷酸腺苷的蛋白质究竟有多稀有。他们采用化学手段创造出许多不同种类的蛋白质,每种蛋白的氨基酸序列都不相同,完全随机。这个人工设计的过程相当于从蛋白质图书馆书架上随机取下一册书卷。研究者制造的随机蛋白质均含有80个氨基酸,这样的蛋白质数量超过10104种,不可能全部在实验中合成出来,但这个实验中所合成的随机蛋白质数量已经相当惊人了:大约有6万亿种。
1700255257
1700255258 基夫和绍斯塔克发现,其中4种毫无关联的蛋白质可以结合三磷酸腺苷。6万亿种蛋白质中有4种可以结合三磷酸腺苷的蛋白质,是不是听上去一点都不富裕?但是按照这一比例,所有包含80个氨基酸的候选蛋白质中能结合三磷酸腺苷的就多了去了:1093个。三磷酸腺苷结合问题的答案是一个天文数字。
1700255259
1700255260 麻省理工大学的约翰·里德哈尔-奥尔森(John Reidhaar-Olson)和罗伯特·索尔(Robert Sauer)研究了同样的问题,但采用的方式不同。他们研究的是一种调节蛋白,这种蛋白可以关闭病毒的基因,后者能感染细菌。这种病毒名为A字形噬菌体,它的DNA所编码的蛋白质使它能自我复制并杀死宿主。但利用开关关掉基因后,这种病毒也可以在细菌体内休眠,直到时机成熟再自我复制并杀死宿主。通常当宿主遭遇不幸时,如饥饿、抗生素污染、过量的紫外线照射,就意味着时机到了,病毒于是趁机开始复制,复制所得的子代病毒冲破细胞,将满目疮痍的细菌遗弃。那场面用一句不恰当的俗话说,大概就是“树倒猢狲散”。
1700255261
1700255262 奥尔森和索尔探索了蛋白质图书馆中这个病毒开关附近的一个社区,随机创造出大量社区中的氨基酸序列,从而探究哪种序列可以产生有效的开关关闭病毒基因。他们计算的结果是,整个图书馆中有超过1050个文本能够编码关闭基因的分子开关。他们把类似的算法应用于另一种蛋白质,即合成氨基酸所需的酶,发现了多达1096种蛋白质可以完成这项工作。
1700255263
1700255264 自然界中的抗冻蛋白给了我们一个提示,之后我们在实验室中则以实验证实了这个猜测:无论是结合三磷酸腺苷,关闭病毒基因,还是催化生化反应的蛋白质,都不是唯一的,应对相同问题的解决方案甚至可能超过100万种。具有不同功能的蛋白质数目是一个天文数字,每一种都对应蛋白质图书馆中的一卷书。图书馆中馆藏数量之多,难以想象。就生物的创造力而言,只有我们想不到,没有自然界做不到。
1700255265
1700255266 事实上,解决特定问题的书在图书馆里取之不尽。当然,知道这一点还不够。我们还要找出这些答案的位置和组织方式,它们是整整齐齐地排在书架上呢,还是随意摞成一堆?仅有实验室的实验是远远不够的,因为即使实验能够合成并测试惊人数量的蛋白质,但与自然界中实际的蛋白质数量相比,依旧显得无足轻重。在自然界中,每一天都有不计其数的生物体在加班加点合成新的蛋白质,每个生物体都是合成蛋白质的量产工厂,而每一个蛋白质都不过是在持续了亿万年的蛋白进化之路上,最后的那一个脚步而已。
1700255267
1700255268 蛋白科学家早就已经注意到了蛋白质的多样性。如果把蛋白质比作糖,拥有数量庞大的蛋白质的自然界就像一家巨大的糖果店,心怀热忱的科学家就像孩子一样一拥而上。比起实验室中得来的数据,科学家在成千上万的生物体中得到的有关蛋白质进化的知识要多得多。我们前面探讨过的斑头雁体内负责输送氧气的血红蛋白就是一个很好的例子。
1700255269
1700255270 血红蛋白的功能不难理解,它往返肺与身体组织之间,完成对氧气的结合或释放,它的重要性也无须赘述。血红蛋白属于一个结合氧气的蛋白质家族,即球蛋白(globins)。球蛋白不仅对我们,对于许多其他的哺乳动物、鸟类、爬行类和鱼类也同样重要。这些物种最初具有共同的祖先,但随后经过无数代遗传,如父辈、子辈、孙辈和数不清的曾孙辈,在一代代演替过程中,编码血红蛋白和所有其他蛋白质的DNA经历了无数次复制。虽然每次复制都极少出现复制错误,对我们的细胞而言,DNA复制过程中大约平均每4 000万个碱基中才会出现一个复制错误,但只要假以时日,只要时间足够长,理论上一个基因组中的所有基因都会出现复制错误,从而导致它们编码的蛋白质产生变化。
1700255271
1700255272 编码氨基酸序列的基因变化后,球蛋白不再按照正确的方式折叠,氧气也就不能流向需要的地方。简单地说,这通常意味着死亡。但发生改变的蛋白质不一定会完全丧失原本的功能和意义。甚至有些改变既不会改变蛋白质的功能,也不损害基因存在的意义,并能够传给下一代。经历无数代繁衍,复制错误,尤其是某些可容忍的复制错误在基因组中逐渐积累,就会慢慢改变蛋白质的氨基酸序列。
1700255273
1700255274 图4-2展示的是人类以及3种物种分类上的亲缘生物,各自血红蛋白中的10个氨基酸片段。图中的每个字母都取自包含20个字母的字母表。科学家通常用字母缩写代表氨基酸:V代表缬氨酸,A代表丙氨酸,诸如此类。大约500万年前,即差不多20万代人之前,我们和与我们血缘关系最近的黑猩猩还拥有一个共同的祖先。由于这段时间还不足以积累大量的遗传错误,因此黑猩猩的球蛋白文本迄今没有改变太多。在图4-2中展示的球蛋白片段里,人类和黑猩猩只有一处不同:在人类血红蛋白为丙氨酸(A)的位置上,黑猩猩的则为谷氨酸(E)。
1700255275
1700255276
1700255277
1700255278
1700255279 图4-2 蛋白随时间变化图
1700255280
1700255281 大约800万年前,人类的祖先和老鼠的祖先分道扬镳。因此比起黑猩猩,老鼠的球蛋白累积变化的时间更长。图4-2显示,人类和老鼠有两处氨基酸差异。鸡的祖先和我们的祖先分开得更早,是在近3亿年前,所以其间累计的氨基酸差异则相应达到了6个。
1700255282
1700255283 还有几百万种生物体含有血红蛋白,除了恒温的脊椎动物,还有爬行类、青蛙、鱼类、海星、软体动物、苍蝇、蠕虫,甚至植物。其中一些物种从生命之树的同一枝条上生长出来,距离它们拥有同一个祖先的日子还不太远。它们的球蛋白基因在生物史上的大部分时间里都是相同的,只是在最近才分道扬镳,但是依旧十分相似。另一些生物体位于生命之树的不同树枝上,距离它们拥有共同祖先的日子较久远,控制球蛋白合成的基因相差也更大。但不管这种差异有多大,它们编码的球蛋白都能正常工作,否则这些球蛋白基因就不会存留至今。每个幸存的基因解决氧气结合问题的方案都不尽相同。生命每延续1 000年,就会进入蛋白质图书馆的更深处,在随机进化之旅中探索全新的球蛋白文本。
1700255284
1700255285 想知道球蛋白在进化之旅中走了多远,需要想想我们最远的亲戚:植物。尽管植物没有血液,但事实上还是有一些植物能够合成球蛋白。
1700255286
1700255287 大豆、豌豆、苜蓿等豆科植物可以从空气中吸收至关重要的氮元素,而空气中的氮几乎是取之不尽的。(其他植物大多需要从土壤中吸收氮,除非农民施用化肥,否则土壤的氮含量通常很低。)豆科植物借助细菌从空气中吸收氮,这种细菌成群结队生活在植物根部附近,体内含有一种特殊的酶,能将空气中的氮气转化为铵盐,铵盐也是含氮化肥的主要成分。这种天才的共生关系只有一个缺点:大气中的氧气会破坏固定氮气的酶。植物为保护这种酶而合成球蛋白,根部的共生细菌因而得以远离氧气。
1700255288
1700255289 植物和动物的共同祖先可以追溯到10亿多年前,动植物处于生命之树不同的主枝上,两者间的球蛋白的差异大得惊人,这表明动物和植物相互独立的进化旅程已进行了很久。举个例子,羽扇豆和昆虫的球蛋白中几乎有90%的氨基酸都不同。然而,如图4-3所示,这些球蛋白不仅都能结合氧气,折叠形状也十分相似。左图是一种豆科植物的球蛋白折叠,右图是一种小型双翅昆虫摇蚊的球蛋白折叠。两种蛋白质都有几处螺旋体一样的结构,例如左上方和右下方有两处排列十分相似的平行螺旋。图像无法完全说明这两个球蛋白有多相似,如果你转动分子,把其中一个覆盖到另一个分子之上,就会发现两个分子中原子的空间分布几乎一模一样。尽管已经各自独立进化了10亿多年,但这些球蛋白的折叠方式依然十分相似。
1700255290
1700255291
1700255292
[ 上一页 ]  [ :1.700255243e+09 ]  [ 下一页 ]