1700254943
每过100万年——相当于人类在进化树上与黑猩猩分离至今的1/5,大肠杆菌的基因组就能获得大约60多个新基因,所有的新基因都来自水平转移。它们是基因融合中的成功者,还有很多失败的基因融合没能让细菌留下后代。
1700254944
1700254945
如今我们已经掌握了超过1 000种细菌的DNA序列信息,它们证实大肠杆菌菌株间的差异并不是特例,而是普遍规律。细菌基因组的大部分基因都是从别处交换得来的。你可能不会觉得奇怪,不过许多这些基因的起源的确难以追溯。要寻找某个特定基因来源的难度,无异于在国会图书馆中随手拿起一本小说并挑选其中的一小段,然后考证这一段内容在文学史上的影响。1 000多个菌种,甚至1 000种菌种的100倍,也只是由无数种细菌构成的多样性海洋中的区区一滴水而已。更多的细菌甚至还没有被我们发现,而每一种细菌都可能是其他细菌基因的贡献者。
1700254946
1700254947
由于细菌基因组中只有大约1/3的基因与代谢有关,所以基因组改变和代谢改变并不总是一一对应的。基因组编码的蛋白质还有许多其他作用,如帮助细菌移动、转运合成所需的物质等。那么如果基因转移主要涉及这些与代谢无关的基因会如何呢?生物进化在代谢图书馆里的步伐将难以深入,进而导致多数生物的代谢反应高度相似。
1700254948
1700254949
实际情况是怎样的呢?几年前,在面对数百种DNA序列已经被阐明的细菌时,我就这样问过自己。这些遗传信息是前人在过去几十年里的研究所得,这项研究发现了数千种独特的酶以及编码它们的基因,让我们能够通过基因辨认相应的酶,并通过酶预测生物具有的生化反应。换句话说,我们可以通过基因组序列预测某种生物的代谢基因型,并对不同生物的代谢基因型进行比较,而这正是我所做的工作。
1700254950
1700254951
图3-2以简化的片段对两种生物中的10种酶的代谢基因型作了比较,展示了用这种方式比较代谢基因型的简便性。10种酶中有4种是两种生物都无法合成的,在图中以灰色的0表示,第一种生物编码了其中6种,如你所见,它的基因型数列中有6个1,而第二种生物可以编码其中的5种。
1700254952
1700254953
1700254954
1700254955
1700254956
图3-2 基因型差异
1700254957
1700254958
我们记录了至少被两种生物中的一种所合成的酶的数量(在这里是6),以及只被其中一种生物合成的酶的数量(在这里为1),然后再计算两者的比值(也就是1/6)。如果两者的比值为0,意味着两种生物编码的酶完全相同。如果该比值为1/2,那就意味着其中一种生物合成的酶中有一半能够被另一种生物合成[13]。而如果这个比值为1,那么两种生物中的任何一种能够合成的酶都不会出现在第二种生物体内,两者的代谢差异为可能达到的最大值。这个取值范围为0~1的比值,反映了两种不同的生物在酶学上的差异程度,鉴于这样的描述不太简便,我们姑且以字母D代表这种差异或差距。
1700254959
1700254960
如果让你用纸和笔比较数百种细菌的基因型,其中每个基因型都以数千种反应对应的数列编码,其枯燥程度不言而喻,好在忠实可靠的计算机能够在眨眼间完成这些工作。虽然我早就知道细菌的基因组间存在高度差异,但当我要求计算机计算数百对细菌的D值时,我还是被近亲菌株之间的代谢遗传差异震惊了。13种大肠杆菌的不同菌株之间有超过20%的酶互不相同,任意一对微生物之间的平均酶差异达到50%。我还曾经怀疑过是否生活环境相近的细菌,比如都栖息于土壤或都栖息于海洋,会由于营养条件相近而拥有类似的代谢体系。我又想错了。相似的栖息地并没有能够缩小细菌之间的D值差距。
1700254961
1700254962
这项工作的结果凸显了自然界在基因重新组合上的惊人尺度。在地球上的每个角落,剧烈的基因拆分和重组都在不断发生。只要是有微生物存在的地方,无论是在海洋深处还是荒凉的山巅,无论是在滚烫的热泉还是寒冷的冰川,无论是在肥沃的平原还是干燥的沙漠,甚至是在我们的体内或体表,生命都在尝试每一种可能的基因新组合,重新解读、重新编译,而后重新布局代谢遗传,片刻也不停歇,造就并不断提升着代谢的多样性。
1700254963
1700254964
1700254965
1700254966
1700254967
如果没有读者,一本书就不过是一堆沾染墨水污迹的纤维纸片而已。同样的道理,代谢图书馆里的基因馆藏需要被阅读才能体现它们本身的价值,即每本书所对应的代谢模式应可以代表某种生物可以利用哪些营养物质,又能够合成哪些分子。我们回忆一下某些实实在在、可以被看见的生物表现型,许多代谢表现型如每天的阳光一样朴实可见。比如黑色素,存在于我们体内,可以保护我们的皮肤免受太阳辐射的伤害;存在于在狮子的毛发中,可以帮助这些大猫在狩猎的时候模拟周围的环境;同时它也是章鱼喷出的墨水之所以是黑色的原因。与黑色素类似的分子都是代谢的产物。
1700254968
1700254969
其他的色素分子也给树叶、龙虾、花朵以及变色龙染上了相应的颜色,帮助它们防御、求偶,有时甚至根本没有其他的用处。不过代谢表现型并不局限在肤浅的视觉水平,它还存在于我们的眼睛看不见的生化层面,继而不断影响着自然选择。代谢表现型最重要的作用在于保证生物的存活率,归根结底,是与那60多种比色素分子重要得多的基本物质合成有关的能力。存活率,是一种对基因表现型的优劣进行衡量的方式,相当于对一个复杂的故事进行主旨概括,或是一场庭审中的最终判决:如果无法合成所有的基本生命物质,那么就判死刑,并立即执行。任何发生突变致使基本生命物质合成受阻的生物,不是无法存活到可以繁殖的年纪,而是根本无法存活。
1700254970
1700254971
为了理解决定生死的表现型,我们必须读懂生物的代谢基因型。这并不容易,不仅是因为基因文本的功能含义要比文本本身复杂得多,我们必须从生物整体上进行把握,考虑不同基因之间的协同效应,还因为我们的大脑并不擅长解读化学语言。幸运的是,我们可以利用计算机与编程演算,协助我们完成这项工作。
1700254972
1700254973
基因型可以告诉我们代谢中涉及哪些催化反应,反应中需要消耗哪些原料分子,又能够合成哪些产物。在解读基因型之前,我们必须首先确定营养物质的来源,俗话说得好,“巧妇难为无米之炊”。然后我们需要检验某种生物的代谢能否利用这种营养物质合成生物必需物质,譬如色氨酸。这对于能够在极端环境中生生不息的生存大师们来说并不难,比如大肠杆菌。这些极端的环境中营养物质稀缺,有时候只有一种糖类可供生物作为能源和碳源。
1700254974
1700254975
我们会从环境中存在的营养物质入手,罗列一张清单,枚举所有营养物质通过代谢反应能够获得的产物,然后在生物的基因组内寻找消耗这些产物的代谢反应,并列出这些反应的产物。我们需要重复这几步,直到找到一个或多个反应的产物中包含色氨酸。如果最后没能找到这样的反应,那么这种生物的代谢反应就无法合成色氨酸。
1700254976
1700254977
接下来,我们可以把注意力转移到另一种生物基本物质上,可能是另一种氨基酸或是DNA的4种基本单位之一,重复上述整个步骤,以检验每一种构建生物的基本物质是否包含在该物种的代谢反应中。只有能够合成所有生物基本物质的物种才有可能存活。
1700254978
1700254979
所有这些工作都是在计算机上完成的,如果使用恰当,计算机运算的速度更快、成本更低,甚至比传统的实验结果更可靠。但正如纸上谈兵并不等于可以攻城略地,对生物学家来说,任何没有经过实验验证的计算结果都需要谨慎对待。正如工厂会对出产的产品进行随机抽查,我们也需要抽选一种已知基因型的生物,将其培养在成分已知的环境中,然后静观其变。其实也可以说是冷眼旁观,任它们自生自灭。这种工作早就已经有人做过了,他们实验的对象包括了数百种大肠杆菌的变种菌株,这些变种大肠杆菌都通过基因工程敲除了某一种酶。实验结果与计算机演算结果高度吻合:超过90%的菌株实验与演算结果相符。
1700254980
1700254981
大多数知道这项演算实验的生物学家都把它当作理所当然,并不觉得这项工作有多稀奇。但事实上,这远不止是稀奇而已,能够通过计算机预测生物生存能力的技术具有深远的开拓性意义,它是数百年的传统生物学研究与现代计算机科学结合的产物。达尔文以及在他之后的几代生物学家大概做梦也想不到,有朝一日世界上会出现这样的技术,而计算机技术对于我们理解代谢进化,理解大自然如何创造出了新的代谢模式至关重要。
1700254982
1700254983
对于任何已经了解其代谢功能的生物而言,在任何成分已知的环境中,无论是极地土壤、热带雨林、海底深渊,抑或是山地草甸,我们都可以用这种算法进行模拟。这种算法同样适用于评估代谢表现型的任何层面,比如预测代谢反应中能够合成的所有分子。不过,在能够进行演算的所有方面中,合成生物基本物质的新手段与利用能源物质的广泛适应性是最重要的层面,而生物存活率则是这一切的根本意义所在。新的代谢能力是不断驱动生命拓展最前沿阵地的引擎。
1700254984
1700254985
利用新物质作为燃料的能力之所以如此重要,其原因非常简单:无论一种代谢方式在今天看来有多成功,由于世界的瞬息万变,它几乎注定会在未来的某一天掉下神坛,正如将随着不可再生的化石燃料日渐枯竭而凋零的全球经济。环境中的化学成分也是一样,营养物质总是旧去新来,从来不会一成不变。依赖某几种特定营养物质的生物容易走入进化上的死胡同。生命如果想繁衍下去,就必须寻求新的代谢方式。万幸的是,许多不同种类的分子都可以为生命体提供能量和必需的化学元素,有我们熟悉的葡萄糖和蔗糖分子,也有一些可能相对陌生,比如剧毒的五氯苯酚。
1700254986
1700254987
只需要较少的几种原料分子,就可以组合出数量惊人的代谢类型。它们的可能数量相当巨大,不过并不是所有这些代谢表现型都能保证生物的存活。如果想对这个计算题有个大致的印象,我们来看图3-3中列出的100种潜在的燃料物质。然后,我们来统计一下某种你感兴趣的动物、植物或细菌是否能够利用某种特定的物质,比如葡萄糖。如果这种生物可以利用葡萄糖合成所有其他所需的基本物质,就把葡萄糖标记为“1”,否则标记为“0”。接着,我们对下一种物质重复同样的步骤,直到所有物质旁边都有相应的“0”或“1”标记。这个清单中的每一个“1”都意味着你考量的生物能够只利用对应的物质合成所有必需的基本物质。
1700254988
1700254989
1700254990
1700254991
1700254992
图3-3 代谢表现型
[
上一页 ]
[ :1.700254943e+09 ]
[
下一页 ]