1704828863
未来50年 第2篇 未来的实践
1704828864
1704828866
小摩尔定律
1704828867
1704828868
R·道金斯
1704828869
1704828870
有过伟大贡献的人已经走得很远了,但有时为了自己高兴他们会走过了头。在评论《双螺旋》时,梅达瓦(Peter Medawar)写道,68“假如谁愚钝到不能认识[分子遗传学]的系列发现是20世纪最伟大的科学贡献,就根本不值得跟他来讨论。”他当然明白自己在做什么;他和他所评论的那本书的作者一样,在很大程度上是有资格高傲一点的。不过你也不必那么“愚钝”地去反驳他的意见。那么,英美人的那个以“新达尔文现代综合”出名的系列发现呢?物理学家为相对论或量子力学、宇宙学家为膨胀的宇宙,都能找到很好的骄傲的理由。“最伟大的”东西到头来是谁也说不准的,但分子遗传学革命无疑是20世纪——也是人类有史以来——最伟大的科学贡献之一。在未来50年里,我们能把它引向何方?或者,它将把我们带向哪里?到了那时,历史也许会证明,梅达瓦比他的同辈甚至他自己所想象的,离真理更近。
1704828871
1704828872
如果要我用一个词来总结分子遗传学,我会选择“数字的”(digital)。当然,孟德尔的遗传学,对基因在族谱中独立分配来说,是颗粒的,也是数字的。但基因的本性还是未知的,它们仍然是物质的东西,不断改变着数量、力量和品性,不可分割地跟它们外在表现卷在一起。沃森和克里克的遗传学是地道的数字的,连它的骨干即双螺旋本身也是数字的。一个基因组的大小可以用几十亿个基来度量,就像拿几十亿个字节来度量硬盘的大小一样精确。实际上,基与字节这两个单位可以通过一个常数因子相互转换。今天的遗传学纯乎是一门信息技术。正因为这一点,北极鱼的抗冻基因能复制到西红柿的身上。
1704828873
1704828874
在沃森和克里克联合发表他们著名的论文以来的50年里,69引发的知识爆炸跟任何一个受欢迎的爆炸一样,在以指数形式增长着。我想我说的就是爆炸。还有一个类似的更有名的爆炸的例子可以支持我的说法——例子来自传统意义的信息技术。摩尔定律指出,计算机的能力每18个月增强1倍。这是一个经验定律,没有公认的理论基础,尽管纳森·迈尔沃德(Nathan Myhrvold)提出了一个能巧妙地“自我证明”的候选者:“纳森定律”说,软件增长比摩尔定律还快,所以我们才有摩尔定律。不管基本的理由是什么,也不管它是多少理由的复合,摩尔定律在近50年的时间里都是成立的。许多分析家预计它还能继续成立50年,在人类事物中产生令人惊奇的影响——但那不是本文关心的事情。
1704828875
1704828876
我关心的是,在DNA信息技术里有跟摩尔定律相当的东西吗?最好的度量当然是经济的,因为钱是工时和机器消耗的最佳复合指标。几十年过去后,一定基本数量的钱能排序多少个基本单位的DNA呢?它以指数方式增长吗?如果那样,它多长时间增加1倍呢?注意,在这样的方式(这是DNA作为信息技术分支的另一个方面),DNA来自哪种动物和植物是没有区别的。在任何一个10年,排序技术和花费完全是一回事情。实际上,除非读了信息本身的内容,否则不可能知道那个DNA来自人、来自蘑菇还是来自细菌。
1704828877
1704828878
虽然选择了经济指标作基准,我还是不知道如何度量实际的花费。幸运的是我想到了问我的同事,牛津大学遗传学教授霍吉金(Jonathan Hodgkin)。我高兴地发现,他最近在为母校准备一个演讲时也做过同样的事情,他慷慨地把他对花费的估计寄给了我。他计算的是排列每一个碱基对(也就是每个DNA码的“字母”)所需要的英镑数。1965年,为细菌的5S核糖体的RNA排序时(不是DNA,不过RNA的花费是一样的),每个字母大约需要1000英镑。1975年,为病毒X174的DNA排序时,每个字母大约需要10英镑。霍吉金没能找到1985年的好例子。不过,在1995年,每个字母只需要1英镑就能排序Caenorhabditis elegans的DNA。那是分子生物学家非常钟爱的一种小线虫,不说名字也都知道是“它”。702000年人类基因组计划达到顶峰时,每个字母的排序花费大约是0.1英镑。为了说明真实的增长趋势,我把那些数字转换成“钱换来的东西”——就是说,一定数量的钱可以排序的DNA的数量。扣除通货膨胀的因素,我选择1000英镑为基数。我把每1000英镑排序的DNA碱基数(以千为单位)画在对数坐标上,这样做很方便,因为指数形式的增长将表现为一条直线(见后面的图)。
1704828879
1704828880
我必须强调,正如霍吉金教授做的那样,这4个数据点是在信封的背面计算的。不过它们确实令人信服地接近一条直线,说明我们DNA排序能力的增长是指数形式的。加倍的时间(或花费减半的时间)是27个月,大概可以跟摩尔定律的18个月相当。DNA的排序依赖于计算机的能力,在这个意义上(很大程度上),我们发现的这个定律也许应该归功于摩尔定律本身,这也为我那个玩笑的题目“小摩尔定律”找到了根据。71
1704828881
1704828882
我们永远也不能指望技术以如此的指数方式进步。我没有把图画出来,但是,假如看到飞船的速度、汽车的燃料价格或者摩天大楼的高度像指数那样增长,我一定会感觉惊讶。我猜它们以某种接近算术加法的方式增加,而不会在一定的时间内加倍再加倍。实际上,已故的伊万斯(Christopher Evans)早在1979年摩尔定律几乎刚开始的时候,就写道:
1704828883
1704828884
今天的汽车在许多方面都跟战后那些年的汽车不一样……不过我们可以设想一下,假如汽车工业在这些年里也像计算机那样发展,那么最新款式汽车的价格会便宜多少、效率会提高多少呢?……今天你大概可以用1.35英镑买一辆劳斯莱斯,它1加仑汽油能跑300万英里,它产生的马力还能驱动伊丽莎白女王二世号72。如果你对小型号感兴趣,还可以拿七八辆来放在针尖上。73
1704828885
1704828886
在我看来,空间探测很可能也像汽车那样不紧不慢地以加法的方式发展。我想起克拉克(Arthur C.Clarke)讲过的一个迷人的猜想,他的预言本领是令人难忘的。想象未来的一只飞船向着遥远的恒星飞去,即使以当时技术所能允许的最高速度飞行,它也需要好多个世纪才能到达那遥远的终点。在它还没走完一半的时候,一艘更快的飞船追了上来,那是100年后的技术产儿。于是,我们大概可以说,原来那个飞船本就不该忙着发出去。同样的道理,第二艘飞船也不应该发射,因为船上的人们注定会看着他们的重重孙子们坐着第三艘飞船从身旁飞快地掠过……其实,只要我们指出,没有前辈的慢的技术的研发,就不会有后来的快的飞船,悖论就解决了。有人认为,完整的人类基因组计划可以现在从头开始,而且只需要实际计划的部分时间就能完成,这样,原先的计划本该适当推迟一些时候。谁提出这样的建议,我也拿上面的话来回答他。
1704828887
1704828888
如果说我们的4个数据点勉强可以作为一个大概的估计,那么把直线外推到2050年就更不可靠了。不过跟摩尔定律类比,特别是,如果“儿子定律”确实与它的“父亲”有点儿关系,那么直线可能代表着某个合理的预言。至少,我们可以看看它能把我们引向何方。它告诉我们,在2050年的时候,我们可以用今天的100英镑(大约160美圆)完成一个人的基因组排序。除了“那个”人类基因组计划,每个人都能负担他个人的基因组计划。种群遗传学家们将获得人类多样性的最终数据。我们有可能画出一个把世界上的任何一个人跟任何其他人联系起来的谱系图。这是历史学家苦苦追寻的一个梦。他们将利用基因的地理分布来重现几百年来的大移民和大入侵,追溯海盗的长船航行;他们根据基因去跟踪从阿拉斯加到火地岛的美洲部落,跟踪撒克逊人穿过不列颠,寻找犹太人散居的证据,甚至发现尚武好斗的成吉思汗们的现代子孙。
1704828889
1704828890
今天,胸腔X射线可以告诉你是否有肺癌或者肺结核。到2050年,用胸腔X光的钱,你可以知道每个基因的全部信息。医生给你的,不是大家一样的病历本,而是针对你个人的基因组的处方。那当然是好事情,但你个人的清单也惊人准确地预言了你的自然终点。我们需要知道那样的东西吗?即使自己想知道,我们会把个人的DNA图交给保险计算员、血缘律师或者政府吗?即使在仁慈的民主社会,谁也不会为那种前景感觉幸福。我们还担心,会不会有某个未来的希特勒来滥用这些知识。
1704828891
1704828892
这些担心尽管很重要,但也不是我这篇文章要说的。我要退回自己的象牙塔,关心更专业的东西。假如100英镑能排序一个人的基因组,那么它也能用来买其他任何动物的基因组。大小都差不多为几十亿个基的数量级,所有脊椎动物都一样。即使假定“小摩尔定律”在2050年之前就失效了(很多人都是那么想的),我们仍然可以放心地预言,我们每年在经济上能够排序的基因组,可以来自几百种典型的脊椎动物、几千种昆虫或其他非脊椎动物、几十万种细菌、几百万种病毒,或者数量令人不安地变化着的爬行动物或者开花植物。获得那么一堆杂乱的信息是一回事,用它们来做什么则是另一回事。我们应该如何消化它们?筛选它们?比较它们?使用它们?
1704828893
1704828894
一个不那么野心的目标是通过那些信息来最终把握系统发育的谱系。毕竟我们已经有了一个真正的生命谱系——实际发生的那个独一无二的生物进化分支模式。它确实存在着,也可以从理论去认识。我们现在还知道得不完全。到2050年的时候,我们应该知道了——假如还不能知道,也只是数不清谱系大树上的细枝嫩丫,因为我们不知道物种到底有多少(正如我的同事迈(Robert May)说的,关于物种的数量,我们知道的至少也要差一到二个数量级)。
1704828895
1704828896
我的研究助理提出,2050年的博物学家和生态学家将随身携带一个小小的野外分类工具包,这样就不需要把标本寄给博物馆的专家去鉴别了。在便携式电脑上接一个精细的探头,把探头插入一棵树、一只新捕获的田鼠或者蝗虫,电脑会在几分钟的时间内检查几个关键的DNA片段,然后确定种属的名称和其他可能储存在数据库里的细节。
1704828897
1704828898
1704828899
1704828900
1704828901
DNA分类已经发现了一些令人惊奇的东西。根据我过去做动物学家的经历,要我相信河马与鲸鱼的关系比与猪的关系更近,几乎是难以忍受的。这一点还有争议。到2050年,这个问题跟其他无数争论一样,总会有办法解决的。说它能解决,是因为那时候河马基因组计划、猪基因组计划和鲸鱼(假如到那时它们还没有被我们的日本朋友吃干净的话)基因组计划都要完成了。实际上,为了最后清除分类的不确定性,并不需要把所有基因组都全部排列出来。
1704828902
1704828903
一个附带的好处,可能在美国产生巨大的影响:如果彻底弄清了生命的谱系,要怀疑进化的事实就更加艰难了。在这个问题上,化石相对说来没有多少意义。因为在现存的那么多我们能排序的物种里,几百种独立的基因相互证明,确立了那个真实的生命谱系。
1704828904
1704828905
有句话老被人提起,几乎说滥了,不过我还是要再说一次:认识一个动物的基因组并不等于认识了那个动物。根据布雷纳(Sydney Brenner,惟独这个人,我听说人们一直很奇怪为什么诺贝尔奖到现在还没给他74)的观点,从基因组“计算”动物,我想应该分三步走,一步比一步难。第一步根据基因的核苷酸序列计算蛋白质的氨基酸序列,这很难,不过现在已经完全解决了。第二步根据氨基酸的一维序列计算蛋白质的三维卷曲模式。物理学家相信这在原则上是可以做到的,但做起来很困难,而且更灵活的办法通常是制造蛋白质,然后看它会发生什么事情。第三步根据基因和它们与环境(多数由其他基因组成)的相互作用计算发育的胚胎。这是目前为止最困难的一步,但是胚胎学(特别是关于同源和相似基因的)进步很快,到2050年时有可能解决它。换句话说,我猜想2050年的胚胎学家可以把未知动物的基因组输入计算机,然后计算机模拟胚胎的发育,最后生出一个完整的动物。这本身算不得特别有用的成果,因为子宫或卵总是比电子计算机更廉价的计算机。不过它从一个方面标志着我们的认识已经完整了。而具体实现那样的技术也是有用的。例如,侦探可以根据他发现的一丝血迹用计算机生成一张嫌疑犯的脸——甚至从婴儿到暮年的一系列脸,因为基因是不会老的!
1704828906
1704828907
我还想,到2050年的时候,我梦想的那本“死者基因大全”将成为现实。达尔文的理论表明,物种的基因一定能描绘一幅祖先的环境的图像,因为它们就是从那样的环境幸存下来的。物种的基因库是自然选择塑造的泥胚。我在《解开彩虹》里说过:75
1704828908
1704828909
沙漠的风塑造出形态迷人的断崖,海浪拍打出奇异的岸礁,骆驼的DNA从古老的沙漠甚至更古老的海洋里雕琢出来,然后成为现代的骆驼。假如我们能听懂骆驼DNA的语言,它会向我们诉说它祖先变化的世界;假如我们懂得那些语言,金枪鱼和海星的DNA会把“海洋”写进课本,而鼹鼠和蚯蚓的DNA会吐露“地下”的秘密。
1704828910
1704828911
我相信,到2050年的时候,我们能读懂那些语言。我们把未知动物的基因组输入计算机,计算机不仅能重塑动物的形态,还能再现它们祖先(当然是自然选择出来产生那个动物的祖先)生活的世界,包括掠食者和牺牲者、寄生者和宿主;包括它们的巢穴,甚至还有它们的希望和恐惧。
[
上一页 ]
[ :1.704828862e+09 ]
[
下一页 ]