1700255093
不要说图书馆,哪怕是仅仅包含葡萄糖代谢的文本就已经是一个超宇宙常数了。代谢图书馆里堆到天花板的那些书,其实不过是在用不同的方式诉说着同一个故事。
1700255094
1700255095
万万没想到的是,我们在探索过程中还发现了这座图书馆的一个更诡秘的特征。那数千个随机游走的算法并没有终结在文本内容相同的书堆中,也就是一小群类似的代谢反应模式里。随机游走沿途经过的所有代谢模式,不论是与原本的大肠杆菌还是其他模式相比,都一样天差地别。每种代谢基因型所编码的代谢模式,包含的生化反应都各不相同。不像现实中的图书馆会设置历史书籍区或科学书籍区,代谢图书馆并没有严格地按代谢的类别划分区域。
1700255096
1700255097
最让我们惊讶的是,当我们以任意一种代谢模式作为新起点,以保证生物的存活为前提,以保证某种特定的性状不变为前提进行随机游走时,我们最终总是能找到一些类似的文本,而不论它们离起点有多远。这似乎意味着,图书馆中主题相同的馆藏相互联系,形成了一张网络,我把这张网络称为基因型网络(genotype network)。它看起来可能有点像图3-6中那张由直线构成的网络,整个矩形即代表代谢图书馆,而其中的线段将同一个社区的文本(图中的圆圈)连在一起。这张图只能作为视觉上的辅助,以二维代替五千维,以有限的圆圈代表难以计数的文本,不过除此之外,我们暂时还没有更好的办法来演示如此诡异的图书馆。
1700255098
1700255099
1700255100
1700255101
1700255102
图3-6 基因型网络示意图
1700255103
1700255104
在一座普通的图书馆里,你很有可能在历史图书区找到一本有关查尔斯·达尔文的书,当然你也可以在传记图书区找到类似的书。而如果在一所采用美国国会图书馆分类法的大型学术图书馆里,你应该能够在QH区(代表“科学:自然史,生物学”)、DA区(“世界史,不列颠”)、GN区(“人类学”)、PR区(“英国文学”),甚至BL区(“宗教,神话,理性主义”)找到类似的书。但是在代谢图书馆的组织原则里,你找不到一丝这样分区的痕迹,你也找不出两本分别在HM区(“社会学,概论”)和BT区(“教化论”)的书有何关联,除非你沿着“达尔文生平”这个线索,循着一本又一本相邻的书在图书馆内前进。没有这些以不同口吻和角度描写达尔文的馆藏作为线索,你很快就会迷失在浩瀚的书海里,寸步难行。
1700255105
1700255106
我们在代谢图书馆里正是这么做的。含义相同的无数文本在图书馆内就像散布在宇宙中的星辰,中间隔着广袤的未知空间。但实际上它们并非处于孤立状态。它们之间以城际高速相连,高速路上灯火通明。
1700255107
1700255108
到这里为止,我们仅仅对一个主题的馆藏完成了分类,即以葡萄糖为维生物质的代谢,除此之外还有许多其他的主题。有的代谢类型能够以乙醇、乙酸以及数十种其他物质支持生命。我们以相同的归档方式对它们进行了制图:以某种代谢表现型作为前提进行随机游走的演算,如以能够利用乙醇为例,直到我们无法在保有这种性状的基础上再前进一步。我们针对80种不同的物质进行了计算,而每次我们都能看到类似的模式。建立在同一种物质代谢基础上的基因型的代谢相似度可以仅为20%,正是它们在代谢图书馆中连成了一张宽广而稀疏的网。
1700255109
1700255110
有了这个普遍规律作为初步结果,我们便斗胆将目标转向了能够同时利用多种物质维生的代谢类型,如能够同时利用乙醇、葡萄糖以及乙酸。(能够利用多种物质的优势显而易见:生物不至于因为其中一种物质耗尽而无法生存。)由于这种代谢方式更复杂,所以会不会只有图书馆内某个角落里为数不多的代谢型能够实现?事实证明我们又想错了。我们研究了能够利用5种、10种、20种乃至60种不同物质的代谢型。每一个随机游走的演算都到达了距离起点相当远的位置。即便是同样能够利用60种不同物质的不同代谢模式之间也只有30%的生化反应相同。即使如此,这些数量在万亿级别的表现型相同的代谢,依旧组成了一张相互联系的基因型网络。
1700255111
1700255112
到了这一步,我几近狂喜。我们偶然发现了代谢图书馆内组织构建的最基本原则。首先,许多代谢型都能够以相同的物质作为能源,这与具体的能源物质种类关系不大。生物通过对不同化学反应进行千奇百怪的组合,合成了必需物质。其次,相同的能源并不意味着相同的代谢,这些代谢型往往只有一小部分生化反应存在交集。最后,我们演算得到的代谢型都在一张巨大的网络中相互联系,这张网络就是基因型网络。每一类代谢都有各自的基因型网络,所有的网络在代谢图书馆里互相纵横交织,仿佛一块致密的绸缎。
1700255113
1700255114
我们以有限的预算完成了这项工作,我们的计算机集群在面对代谢图书馆里的馆藏数量时依旧显得力不从心。不过我们依旧为这个大得超出想象的图书馆绘制了一张粗糙的地图,仿佛乘坐浴缸进行了一次环球旅行。
1700255115
1700255116
1700255117
1700255118
1700255119
同一表现型的不同代谢文本提高了我们找到该性状的概率,而且是成倍提高。此外,进化可不仅仅是一名在图书馆里闲逛的读者。相反,它会招募大量生物进入这座图书馆里寻找新的文本,每发生一次基因转移,生物在代谢图书馆中就深入一步。有着数十亿读者在朝着图书馆内不同的方向展开探索。
1700255120
1700255121
与我们在现实生活中逛图书馆相比,进化探索自然图书馆的方式还有一个不同之处。为了便于理解,我们可以假设有一个生物个体遭遇了一场变故,很可能是一个基因的删除,因此从安全前行的道路上偏离,与原本维持它生存的代谢文本失之交臂。发生在它身上的基因删除可能会摧毁某个关键分子的合成能力,而这个个体毫无生还的可能,自然选择将慷慨地赐予它死亡。这就是代谢图书馆,在那里,有些读者会在延绵数代的探索中消亡,而有的则得以生还。
1700255122
1700255123
从局外人的角度来看,图书馆中的探索者们,无论是细菌还是蓝鲸,并没有比尘埃泥土特别到哪里去。在自然图书馆面前,生命卑微得像无根的野草,在世间到处漂泊流浪。无数生命用自己的身躯试验着不同的化学反应组合,不断地试验,不断地重复。有些一命呜呼,有些则侥幸生还,继而把自己的经验传递给下一代。生命犹如风中翻腾的黄沙,生命进化的过程并不比无处安身的风尘高贵多少。
1700255124
1700255125
基因型网络就是那股风,没有它,生命的黄沙就失去了前行的动力。如果代谢某种物质的解决方案是唯一的,那么所有探索图书馆的读者就不得不挤在某本书周围。任何企图到附近书架开小差的个体都会被淘汰。而如果内容类似的文本稍微多一些,读者们也只能围在图书馆的某一小块区域内。多亏基因型网络的存在,生命才能在保证原有性状的同时,深入探索图书馆的各个角落。
1700255126
1700255127
生物进化的关键因素有两个,基因型网络只是其中之一。我们现在来看看第二个因素:代谢图书馆中社区内性状的高度多样性。
1700255128
1700255129
想象一下,一小块泥土中有着数十亿个细菌,只要偶尔给它们一点接济,比如一片掉落的叶子,一具腐烂的尸骸,或者一个从树上掉下的熟透的苹果,百无禁忌,它们就能生生不息。这些食物中营养物质丰沛,不过前提必须是细菌有能耐消化和吸收它们。换句话说,也就是细菌有适当的酶,可以利用外来的物质合成自己需要的生物成分。当可用的食物全部耗尽,只要有一个细菌拥有利用不同物质的能力,它就很可能会成为其他嗷嗷待哺的细菌的救世主。此时,新的性状就是微生物们延续生命的关键。
1700255130
1700255131
如果我们考量100种利用不同物质的代谢,它们之间的相互组合方式也将轻松超过1030种,而上述那位救世主的代谢模式只是这么多组合里的其中一种而已。要把这1030种代谢放在图书馆里的一个社区内自然是不现实的。每个社区大约只够容纳100多个不同的文本,这仅仅相当于所有代谢表现型的1/1026。这就好比你随手从纽约公共图书馆里借走几本书用来填补你空空如也的床头柜,然后希望这其中包含了达尔文的《物种起源》。换句话说,你在白日做梦。但是,如果是一群读者循着某种指引分散深入到图书馆内,那么这个概率就大不相同了。由于基因型网络巨大无比,所以这群读者能够由此接触到数千个社区,这将大大提高找到目标文本的可能性。
1700255132
1700255133
为了验证这种组织形式是否真的存在,我们挑选了成对的代谢文本,每对文本的表现型都相同(比如利用葡萄糖的能力),除此之外,两个文本没有其他共同点。我们把两个代谢文本编码为A和B,它们位于自然图书馆内两个不同的位置,即它们包含的生化反应几乎各不相同,但它们又都是同一个基因型网络内的成员。接下来我们来检查它们所在社区里的5 000多个其他文本,其中的某些文本也同样具有利用葡萄糖的能力,也就是和我们挑选的文本属于同一张基因型网络,但也有一些失去了某些关键的生化反应,最终导致生物死亡。还有一些相邻文本——它们一直是我们关注的焦点,赋予了生物利用新物质的能力,比如利用乙醇或果糖。
1700255134
1700255135
对于这些基因型网络我们想问的是:A文本所在社区中的文本,即那些与A文本只相差一个生化反应的代谢模式,是否与B文本所在社区内的文本不同?如果A文本的相邻文本中包含能够利用乙醇和果糖的代谢方式,那么B文本所在的社区里会不会也有能够利用其他物质的代谢,比如,利用醋酸和蔗糖?
1700255136
1700255137
在分析了数千对代谢文本以及它们的表现型之后,我们发现之前的预设是正确的。文本所在的社区内往往有着控制新性状的文本,而不同社区内文本的表现型也十分不同。许多代谢性状都是某个社区所特有的,不会出现在其他社区中。(这是因为每种表现型都有自己所在的基因型网络,同时也意味着不同的基因型网络相互交织的方式极其复杂。)
1700255138
1700255139
在计算机的帮助下,我们进行了更进一步的探索。我们再一次漫步于代谢图书馆的基因型网络中,只是这次我们担任的是拿着笔记本的仓库管理员的职责,我们想要把所有与沿途文本直接相邻的文本记录下来,而这些新的文本是最触手可及的。在开始前进之前,我们列出了所有起点文本附近的新性状,之后我们跨出第一步,继续检查当前所有的相邻文本。如果新社区内包含原先没有的性状,我们就把它们加到列表里,然后再往前走一步,检查新的社区,加上新的性状,如此反复,直到走出数千步。我们已经知道不同的社区中包含的性状往往不同,所以我们猜测,随着愈发深入图书馆,列表上记录的新性状会越多,但是我们迟早会记录完所有的性状。
1700255140
1700255141
事实证明,我们的想法大错特错。记事本马上就写满了,但新的性状还是源源不断地涌现出来。
1700255142
[
上一页 ]
[ :1.700255093e+09 ]
[
下一页 ]