1700255056
一方面,寻找到某种特定性状的概率是渺茫的;另一方面,生命表现的多样性表明,进化寻找新性状的能力无须置疑。这也意味着上述假想的情况是错误的。代谢图书馆中包含葡萄糖的文本肯定不止一本,很可能有许多能够利用葡萄糖的不同代谢模式。
1700255057
1700255058
为了找到这些代谢文本,我们来模仿一下进化曾经做过的事:尝试探索图书馆和编辑基因组,也就是对基因组进行一系列删除和转移,消除或增加某些基因、酶及生化反应。从哪里开始入手其实并不重要,我们可以选择代谢图书馆里任何一个馆藏,选择任何一本包含葡萄糖或者其他能源物质代谢的文本。
1700255059
1700255060
现在我们从一个包含葡萄糖代谢的代谢文本开始,随机删除一个文本中已有的反应,或者向文本中加入一个已知的生化反应。这个经过修改的文本在面对大自然的审阅时,得到的回复往往简单粗暴:生或者死。但是作为科学家,我们不用如此循规蹈矩。我们能够通过算法解读代谢文本的含义,如果结果显示新的文本所代表的代谢类型不能利用葡萄糖维持存活,那么就返回原始文本,重新删除或添加一个生化反应。不要忘记,可选的目标基因有5 000种之多。只要经过修改的代谢依旧能够利用葡萄糖,那么这种修改就可以继续下去,接着添加或删除第二个基因,演算对应的表现型,再评估,如此循环往复。
1700255061
1700255062
也就是说,我们从某个起点开始,首先到达与它相邻的文本,再到相邻文本的相邻文本,而后再到相邻文本的相邻文本的相邻文本,直到我们弄清楚在不改变代谢表现型的前提下,即对葡萄糖的利用能力,能够到达的极限距离。由于文本的每一次改变都是随机的,所以在代谢图书馆中的这种移动是一种随机游走(random walk),就像一个走出酒吧的醉汉跌跌撞撞地在路上晃荡,碰巧撞进了自己的家门,只是有一点不同:在代谢图书馆里的每一步都必须踩在主题相同的文本上,也就是沿着相同的表现型前进。
1700255063
1700255064
如果只有一种代谢类型里包含葡萄糖代谢,由于它没有所属的“社区”,那么通过随机游走无法到达任何地方,我们只会停在原地止步不前。不过即便与某种表现型对应的文本不止一本,但只要它们散落在图书馆内不同的角落而没有相邻,我们同样无法从其中一本馆藏出发,直接跨越其他代谢抵达同类型文本。哪怕这些零星的文本聚集在一处,随机游走的脚步也不一定会走得更远。作为起点的文本可能还有几个不多的邻居,但是这些邻里未必有着它们自己的邻居。
1700255065
1700255066
只有当同一主题的文本具有相当的数量时,我们才能循着它们探索整个图书馆。不过如此一来我们又将面对一个新的问题:计算量。计算一个代谢文本的含义不算什么大事,但是如果要分析随机游走过程中的数千个文本就没那么容易了,更不要说随机游走中前进的每一步都有数千种不同的可能性。普通的家用计算机大概需要数年甚至数十年才能完成类似的计算。利用互联网连接的一个计算机集群能够令我们获得更高的计算速度,但其巨额费用也令人难以承担。
1700255067
1700255068
在度过漫长的攻读博士学位的阶段后,我成了一名博士后并最终在美国的一所研究型大学被授予终身教授职位,在这个过程中,资助进化研究的经费日渐枯竭、每况愈下。研究经费的匮乏正好与我远在欧洲的家人的患病撞车,所以那一年,当一份来自瑞士的工作邀请摆在我面前时,我其实早已做好了跨过大西洋、回到故乡的准备。
1700255069
1700255070
一直以来我都知道,瑞士是世界科学的引领者之一,瑞士科学研究的产量惊人、水平拔尖。而科研成功的背后离不开其世界一流的公共教育体系,对学术研究的慷慨资助以及宜人的居住环境。我为不得不离开在美国一起研究学术的同事们而觉得遗憾,同时又对能够进入瑞士的科研圈感到诚惶诚恐。而最重要的是,这份工作不仅能够从资金上支持一个计算机集群,同时也足以维持运营一个现代化的实验室。更妙的是,我能够在世界范围内招募不少和我有类似想法的研究同行。这份工作让我不敢再有别的奢求。
1700255071
1700255072
1700255073
1700255074
1700255075
2006年一个天高气爽的秋日,我坐在自己的办公室里,它位于苏黎世大学一栋外形简朴优雅的建筑内,外墙的玻璃和金属在阳光下反射着微光,勾勒出大楼的轮廓。那天,一个年轻的葡萄牙人走了进来,他长相英俊、说话轻声细语,深褐色的眼睛里闪着好奇的光芒,他礼貌地笑了笑之后,告诉我说他叫若昂·罗德里格斯(Joao Rodrigues)。
1700255076
1700255077
若昂一直在研究物理学,同时也发现生物学中有许多亟待解决的问题。他在寻找一个新的挑战,希望能够通过打破两个学科之间的壁垒获得自己的博士学位。若昂对生物学的了解有限,但他具备很多生物学家没有的本事:他十分擅长数学和计算机编程,也亲自操刀过许多大型和复杂的演算项目。在浏览他简历的时候,我简直抑制不住内心的狂喜。若昂拥有的能力恰好是探索代谢图书馆所必需的。在对他的面试中,我情不自禁,与他分享了我对自然进化的见解。幸运的是,我们一拍即合。我看到他的眼神里闪着光。最终,若昂欣然接受了这份工作。
1700255078
1700255079
在我的实验室里,若昂的学术背景不仅不算特殊,反而是个中典型。这里的研究人员来自十多个不同的国家,有美国以及欧洲、亚洲和澳洲的国家,他们的研究领域各异,包括生物学、化学、物理学和数学。这一切都是刻意而为,因为我们所面对的难题需要不同领域协同合作,因此我喜欢把我们的工作比作进化本身:研究也需要与时俱进,将各种传统研究方式进行重新组合——不是酶的组合,而是学术技能,这将大有助益。
1700255080
1700255081
我们搭建的由100台电脑组成的计算机集群依旧不能使我放心,我担心其计算速度依然不足以让我们离开代谢图书馆里的第一个书架,不过若昂的计算机技能像魔法一样让我印象深刻。他巧妙地提高了计算机的工作效率,使得它们的计算能力提高了数倍,最终把我们远远地送到了图书馆深处。
1700255082
1700255083
若昂的演算始于一种广为所知的代谢:大肠杆菌代谢葡萄糖,它能够以这种单糖为原料合成所有必需的60种基本物质。为了验证大肠杆菌的代谢方式是否独一无二,若昂首先设计了1 000多种大肠杆菌的“邻里代谢”,它们中的每一种都与大肠杆菌的代谢相差仅一个生化反应。如果大肠杆菌的代谢是一本利用葡萄糖合成所有必需物质的说明书,那么这些设计出来的代谢就是这本说明书最接近的山寨版本。首要的问题在于:这些人造的代谢模式是否具备所有利用葡萄糖合成必需物质的信息?
1700255084
1700255085
经过演算若昂很快发现,不是一个、两个或者三个,而是数百个大肠杆菌的“邻里代谢”能够依靠葡萄糖维系生命。这个发现说明了一个简单而重要的结论:认为大肠杆菌代谢葡萄糖这个性状独一无二是一种错误的偏见,基因型所在的社区里包含众多类似的基因型。但是更让我们吃惊的发现还在后面。
1700255086
1700255087
若昂利用大肠杆菌作为起点深入代谢图书馆的探险,把他引向了距离这个起点越来越远的地方。演算的目的是为了测试我们能够以这种方式深入到图书馆的何处:我们希望从一种能够支持生命存活的代谢到达与它相邻的代谢,再从相邻的代谢到与之相邻的代谢,依此类推,同时保持生物利用葡萄糖的能力。在保证主题不变的基础上,代谢基因型能够被编辑的最大限度是多少呢?当若昂给我展示计算结果时,我的第一反应是不相信。他找到的距离最远的代谢,也就是D值最高的代谢,与我们开始时的大肠杆菌代谢仅有20%的相似性。从算法的角度来看,我们几乎已经穿过了整个图书馆,那可是相距最远的馆藏之间80%的距离。在这个距离上,只要再深入一步,我们就找不到包含葡萄糖代谢的文本了。
1700255088
1700255089
因为担心单一的实验可能不具有代表性,我要求若昂再多执行一些随机游走的计算,一共1 000个。对每一个基因型的运算都以保证相同的代谢为前提,演算可能到达的最远距离(D值),对相邻基因型进行尽可能多的尝试。这不是不可能的,因为这座图书馆里最不缺的就是岔路。当结果返还到我手中后,我又一次被震惊了。所有的随机游走都到达了和第一个结果几乎一样远的位置。每一个结果与原始大肠杆菌的代谢模式的差距都几乎达到了80%。
1700255090
1700255091
我们实验室的研究员找到了1 000多种与大肠杆菌代谢基因相差巨大的代谢模式,它们唯一的共同点只有能够利用葡萄糖作为单一碳源和能源进行合成代谢这一点。如果我们继续下去,肯定还能找到更多类似的代谢型,多到我们数不过来。不过我们后来终于学会了如何估计某些代谢型在图书馆内的数量,比如包含2 000个代谢反应、能够利用葡萄糖的代谢文本大约有10750种。
1700255092
1700255093
不要说图书馆,哪怕是仅仅包含葡萄糖代谢的文本就已经是一个超宇宙常数了。代谢图书馆里堆到天花板的那些书,其实不过是在用不同的方式诉说着同一个故事。
1700255094
1700255095
万万没想到的是,我们在探索过程中还发现了这座图书馆的一个更诡秘的特征。那数千个随机游走的算法并没有终结在文本内容相同的书堆中,也就是一小群类似的代谢反应模式里。随机游走沿途经过的所有代谢模式,不论是与原本的大肠杆菌还是其他模式相比,都一样天差地别。每种代谢基因型所编码的代谢模式,包含的生化反应都各不相同。不像现实中的图书馆会设置历史书籍区或科学书籍区,代谢图书馆并没有严格地按代谢的类别划分区域。
1700255096
1700255097
最让我们惊讶的是,当我们以任意一种代谢模式作为新起点,以保证生物的存活为前提,以保证某种特定的性状不变为前提进行随机游走时,我们最终总是能找到一些类似的文本,而不论它们离起点有多远。这似乎意味着,图书馆中主题相同的馆藏相互联系,形成了一张网络,我把这张网络称为基因型网络(genotype network)。它看起来可能有点像图3-6中那张由直线构成的网络,整个矩形即代表代谢图书馆,而其中的线段将同一个社区的文本(图中的圆圈)连在一起。这张图只能作为视觉上的辅助,以二维代替五千维,以有限的圆圈代表难以计数的文本,不过除此之外,我们暂时还没有更好的办法来演示如此诡异的图书馆。
1700255098
1700255099
1700255100
1700255101
1700255102
图3-6 基因型网络示意图
1700255103
1700255104
在一座普通的图书馆里,你很有可能在历史图书区找到一本有关查尔斯·达尔文的书,当然你也可以在传记图书区找到类似的书。而如果在一所采用美国国会图书馆分类法的大型学术图书馆里,你应该能够在QH区(代表“科学:自然史,生物学”)、DA区(“世界史,不列颠”)、GN区(“人类学”)、PR区(“英国文学”),甚至BL区(“宗教,神话,理性主义”)找到类似的书。但是在代谢图书馆的组织原则里,你找不到一丝这样分区的痕迹,你也找不出两本分别在HM区(“社会学,概论”)和BT区(“教化论”)的书有何关联,除非你沿着“达尔文生平”这个线索,循着一本又一本相邻的书在图书馆内前进。没有这些以不同口吻和角度描写达尔文的馆藏作为线索,你很快就会迷失在浩瀚的书海里,寸步难行。
1700255105
[
上一页 ]
[ :1.700255056e+09 ]
[
下一页 ]