1700254980
1700254981
大多数知道这项演算实验的生物学家都把它当作理所当然,并不觉得这项工作有多稀奇。但事实上,这远不止是稀奇而已,能够通过计算机预测生物生存能力的技术具有深远的开拓性意义,它是数百年的传统生物学研究与现代计算机科学结合的产物。达尔文以及在他之后的几代生物学家大概做梦也想不到,有朝一日世界上会出现这样的技术,而计算机技术对于我们理解代谢进化,理解大自然如何创造出了新的代谢模式至关重要。
1700254982
1700254983
对于任何已经了解其代谢功能的生物而言,在任何成分已知的环境中,无论是极地土壤、热带雨林、海底深渊,抑或是山地草甸,我们都可以用这种算法进行模拟。这种算法同样适用于评估代谢表现型的任何层面,比如预测代谢反应中能够合成的所有分子。不过,在能够进行演算的所有方面中,合成生物基本物质的新手段与利用能源物质的广泛适应性是最重要的层面,而生物存活率则是这一切的根本意义所在。新的代谢能力是不断驱动生命拓展最前沿阵地的引擎。
1700254984
1700254985
利用新物质作为燃料的能力之所以如此重要,其原因非常简单:无论一种代谢方式在今天看来有多成功,由于世界的瞬息万变,它几乎注定会在未来的某一天掉下神坛,正如将随着不可再生的化石燃料日渐枯竭而凋零的全球经济。环境中的化学成分也是一样,营养物质总是旧去新来,从来不会一成不变。依赖某几种特定营养物质的生物容易走入进化上的死胡同。生命如果想繁衍下去,就必须寻求新的代谢方式。万幸的是,许多不同种类的分子都可以为生命体提供能量和必需的化学元素,有我们熟悉的葡萄糖和蔗糖分子,也有一些可能相对陌生,比如剧毒的五氯苯酚。
1700254986
1700254987
只需要较少的几种原料分子,就可以组合出数量惊人的代谢类型。它们的可能数量相当巨大,不过并不是所有这些代谢表现型都能保证生物的存活。如果想对这个计算题有个大致的印象,我们来看图3-3中列出的100种潜在的燃料物质。然后,我们来统计一下某种你感兴趣的动物、植物或细菌是否能够利用某种特定的物质,比如葡萄糖。如果这种生物可以利用葡萄糖合成所有其他所需的基本物质,就把葡萄糖标记为“1”,否则标记为“0”。接着,我们对下一种物质重复同样的步骤,直到所有物质旁边都有相应的“0”或“1”标记。这个清单中的每一个“1”都意味着你考量的生物能够只利用对应的物质合成所有必需的基本物质。
1700254988
1700254989
1700254990
1700254991
1700254992
图3-3 代谢表现型
1700254993
1700254994
完成编码后得到的“0”“1”数列描述了给定的新陈代谢利用不同燃料分子维系生命的能力。这是表达一种生物代谢表现型的精简方式。像大肠杆菌这样的代谢通常能够依靠数十种不同的碳源生存下去,因此它们的表现型数列中有很多“1”。与之相对,某些精专的生存大师只能利用为数不多的碳源,所以它们的表现型数列里多数都是“0”。
1700254995
1700254996
在计算100种能源物质能够组合出多少种代谢表现型前,我们只需要牢记,对于每一种物质而言,生物体只有能够或不能够依靠这种物质生存两种结果,除此之外没有第三种可能,因此所有的可能代谢表现型是100个2相乘,也就是2100。这个数量超过了1030,也就是1后面跟着30个零,虽然和现实中实际存在的可能表现型数量相比还有差距,但已经是一个天文数字了,因为这数字已经比银河系中的恒星数量要多了,如果我们非要拿来比较的话,后者仅为1011,也就是“区区”1 000亿。
1700254997
1700254998
现在你可能意识到了:我在上一章就提到过,现代综合进化论的缺陷是它过于忽视生物高度复杂的表现型。现在看来这可不是我在开玩笑。
1700254999
1700255000
表现型的巨大数量同时也意味着代谢进化的巨大潜力。图3-4中给出了一个例子。图中左侧展示了某种代谢表现型能够利用的碳源,但是这种代谢方式无法利用乙醇,因此在乙醇旁标记为“0”。无论是不是通过基因转移获得的,一个新的基因可以通过改变基因型进而让表现型具有代谢乙醇的能力。如果该变异使代谢乙醇成为可能,我们就把“0”改为“1”。由于每一种新出现的代谢表现型都可以用这种标记方式表示:通过把代谢表现型中的某个“0”改成“1”,所以理论上来说,代谢表现型的数量越多,生物的进化潜力就越大。
1700255001
1700255002
1700255003
1700255004
1700255005
图3-4 代谢进化
1700255006
1700255007
1700255008
1700255009
1700255010
由于代谢类型的数量巨大,远远超过宇宙中的氢原子数,所以要腾出一块地方,专门建一栋收纳所有表现型文本的图书馆显得异常艰巨。此外,如果要在这个图书馆里迅速检索到某册馆藏,那么馆内的收藏必须高度有序。我的办公室里有个小图书室,我在那儿只要几秒钟就可以找到以前买的那本《物种起源》,作者正是达尔文。不过,如果要在一个常规大小的大学图书馆里边晃悠边找某本特定的书可就没那么简单了。而如果《物种起源》被人放错了书架,那么可能就永远消失在这个图书馆里了。同样的错误在一所超宇宙数量级的图书馆里导致的后果只会更糟糕。宇宙图书馆里很可能藏着解开长生不老之谜的秘籍,就算没有,也肯定有配方教你如何煮出完美的火鸡填料。但由于图书馆实在是太大了,如果我们不知道这些书摆在哪里,那么我们可能永远也找不到。
1700255011
1700255012
一种相当简便的图书馆归档方式是把书按照内容的相关程度摆放。人类的图书管理员在归类不同印刷版次的同一本书时就会用这种方式。如果代谢图书馆在归类书籍的时候也遵循相同的原则,那么越相似的文本之间应该距离越近。但在讨论归档之前我们首先要解决一个问题:采购或者制作这个图书馆需要的书架将是一件痛苦的活计。
1700255013
1700255014
在现实的图书馆里,每本书都与另外两本书相邻,左右各一本,即使算上书架上下的书,那么一本书最多也只与四本书相邻。但代谢图书馆里的每本书会与多少本其他的书相邻呢?这里我们可以回忆一下代谢图书馆里那些每本由5 000个字母组成的馆藏。每本相邻的书都只相差一个字母,相邻的代谢基因型之间只差一个生化反应。(两个代谢基因型之间的差异无法比一个更小,而当两者差距进一步拉大时,它们就不会被相邻摆放了。)
1700255015
1700255016
我们假设,在与代谢图书馆中任何一本书相邻的其他书中,第一本与原书的第一个字母与原书不同,第二本则是第二个字母不同,每一本相邻的书都依次与原书对应的字母不同,直到最后一个字母。换句话说,代谢图书馆里的每本馆藏不是与两本,也不是与四本,而是与上千本书相邻,具体的数目取决于生化反应数量的多少,相邻的馆藏之间只相差一个字母,也就是一个生化反应。能够满足如此陈列要求的书架可不是那么容易找到的。
1700255017
1700255018
为了帮助你理解这种情况有多复杂,我们先从更简单的情况开始讨论,最简单的化学世界莫过于只有一种化学反应。在那个世界的代谢图书馆里只有两本馆藏。一本的内容是“1”,由唯一的一种化学反应构成;而另一本是“0”,代表该种代谢类型不具有该反应。图3-5中a图的两个端点和连接两者的直线就代表这种情况。
1700255019
1700255020
比直线稍微丰满一点的世界由两个化学反应构成,相应的代谢图书馆规模将扩建到4(22)种可能的馆藏。其中之一同时拥有两种反应(11),有两种代谢型拥有两个反应的其中一个(10,01),第四种代谢型则同时缺乏两种反应(00)。如图3-5的b图所示,这种情况下,每个代谢基因型就如同一个正方形的四个顶点。
1700255021
1700255022
可能你已经明白我接下来要说的事了。下一个级别的世界里包含了三种化学反应以及8(23)种可能的代谢类型,我们用一个立方体的顶点表示这8种代谢。而在一个包含4种化学反应的世界里,我们能够得到16(24)种可能的代谢型,但是哪种几何图形能够与之对应呢?随着例子中化学反应的数量从一到二再到三,对应的代谢型分别占据了一条直线、一个正方形和一个立方体的顶点,不同的几何图形又分别对应一维、二维和三维空间。尽管四维或者更高维度的空间很难用视觉图形的方式呈现,但和它们打交道依旧是数学家们的家常便饭,因为他们能够将已有的几何规则演绎到这些多维空间中。
1700255023
1700255024
就像四边形和立方体,我们所寻找的几何图形的每条边长都应当相同,不同的边相交需要形成一个恰当的角度。如此我们便能够找到一个四维的超立方体。图3-5中的d图就以几何技法展示了超几何体在平面上的视觉效果。具有四维空间的超立方体有16个顶点,每一个顶点对应一种代谢类型,即从0000到1111,不过我们并没有在图中一一标记出。
1700255025
1700255026
1700255027
1700255028
1700255029
图3-5 超立方体
[
上一页 ]
[ :1.70025498e+09 ]
[
下一页 ]