打字猴:1.700268533e+09
1700268533 盲眼钟表匠:生命自然选择的秘密 [:1700267678]
1700268534 盲眼钟表匠:生命自然选择的秘密 第五章 基因档案
1700268535
1700268536
1700268537
1700268538
1700268539 外边儿正在下DNA。
1700268540
1700268541 我的花园尽头,就在牛津运河边,有一棵很大的柳树,它正在释放大量的种子。柳絮迎风飘扬。风向不定,四面八方都是柳絮。运河上上下下,以我的双筒望远镜望去,河面上尽是白茫茫一片,其他方向,想必也是柳絮铺地。柳絮是因为表面有白色的绒毛、柔软如絮而得名,绒毛的成分是纤维素,藏在其中的种仁,就体积来说简直微不足道,种仁里装着DNA—遗传信息。满天的柳絮里,DNA只占微小的比例,为什么我说天上正在下DNA,而不说外边正在下纤维素呢?答案是:DNA才重要。纤维素绒毛尽管体积庞大,不过当作降落伞,用过就丢的。浮生若梦。柳树这出戏,棉质绒毛、花、树的本体等等,都是配角,主戏只有一场,情节只有一个,就是在乡间散布DNA。可不是任何DNA,而是建造另一棵柳树的DNA,更精确地说,是含有特定文本的DNA,那分文本是编过码的特定指令集,新的柳树在那套指令指挥之下发芽、成长、茁壮,然后开始散布新一代的柳絮。飘散在空中的柳絮,正在散布制造自己的指令,不多也不少。它们现在随风飘散,正因为同样的事它们的祖先做得很成功。外边儿满天下的都是指令,满天下的都是程序,都是让柳树发育、柳絮飘扬的算则(algorithm,有明确执行步骤的指令集)。那不是隐喻(metaphor),而是明摆着的事实。即使我说天上正在下磁盘片,也不会更明白。
1700268542
1700268543 这是明摆着的事实,可是大家一直不了解。才不过几年前,要是你问:“生物有什么特质,好与无生物分别的?”几乎每一个生物学家都会跟你大谈什么原生质(protoplasm)。原生质与任何其他物质都不同;它有生机,有活力,是动态的,有韵律的,对刺激有反应的。老师卖弄这些词藻,说穿了不过是指出原生质“会对外界刺激有所反应”(responsive)。要是你找来一个活的生物,将它逐步分解,最后就会得到纯原生质的小颗粒。当年“达尔文斗犬”赫胥黎(Thomas Huxley,1825~1895)相信海底有一层纯原生质的生物(bathybius),它们是“均质、没有结构的物质,一种活的蛋白质颗粒,有营养、生殖功能”。德国演化论大师赫克尔(Haeckel,1834~1919)认为这种“单质生物”(monera)是最原始的生物。我小时候这个概念已经过时了,可是老式教科书上还在讲原生质。现在这个词没有人提了,就像化学的“燃素”、物理的“以太”(aether),“原生质”已经死了。构成生物的物质没什么特别的。生物是分子的集合体,与其他的东西一样。
1700268544
1700268545 这些分子的特殊之处是:生物分子构造比较复杂,必须按照程序制造这些分子。程序是成套的指令,生物体内都有,生物就是按照体内程序发育的。生物也许有生机、有活力、是动态的、有韵律的,总之,对刺激会反应,而且有体温,但是这些性质全是突现的(emerge),附带的。每一个生物的核心,不是火,不是温暖的气息,不是“生命的火花”,而是信息、字、指令。如果你想打个比方,别想火啊、气息、火花什么的。试试“刻在芯片上的几十亿个离散状态的数字字符”。如果你想了解生命,忘了有活力的、会跳动的原生质还是别的什么,想想信息技术。我在上一章结束的地方提到蚁后是中央数据库,暗示的正是这一点。
1700268546
1700268547 先进信息技术的基本需求,是某种记忆容量超大的储存媒体。媒体中每个记忆位置都能处于几个离散态中的某个特定“态”。现在人工制品世界的主流技术—数字信息技术—正有这种特色。信息技术也可以走另一条路,就是以模拟信息为基础。过去的胶盘唱片储存的就是模拟信息—储存在波状的沟槽里(以唱针“读”取)。激光唱片(CD)储存的是数字信息,记录在唱片上一系列微小的“坑”里,每个对应一个特定离散态,绝无模棱之处。那是数字系统的诊断特征:它最基本的要素不是处于一个状态,就是另一状态,没有半个状态的,也没有中间状态的。
1700268548
1700268549 基因的信息技术是数字式的。这个事实是19世纪的孟德尔(Mendel,1822~1884;他的家乡现在捷克境内)发现的,当然,他还没有“数字信息”的概念。孟德尔以豌豆做实验,演绎出的结论是:生物的子代不是亲代基因“混合”的结果。我们从亲代接收的“遗传”是以分离的粒子形式进入合子(受精卵)的。就每一个特定遗传粒子而言,我们不是从亲代得到了,就是没有得到。其实,正如数学遗传学家费希尔(R. A. Fisher,1890~1962)指出的,这个“粒子遗传”事实是显而易见的,只要想想有性生殖就成了。我们的父母(亲代)是一男一女(或一雄一雌),但是我们不是男就是女,没有“中间态”(雌雄莫辨)的。每个新生儿从父母亲遗传男性或者女性的概率大约相等,但是任何一个新生儿不是男孩就是女孩,不会两者混合(加起来除以二?)。我们现在知道所有我们从父母继承的粒子都是这样。它们不会混合,即使在世代遗传过程中它们会不断地被“洗牌”(重新组合)。当然,诸遗传单位对身体的影响往往会造成“它们混合了”的强烈印象。要是一个高个子与一个矮个子,或者一个白人与一个黑人结婚了,他们的子女往往看来是“中间型”。但是“混合”的表现只适用于遗传粒子对于身体的影响,因为影响身体的粒子数量很大,而每个遗传粒子对身体都有微小的影响,身体表现的是大量粒子影响力的集合。可是在遗传过程中,遗传粒子彼此独立、不相混合。
1700268550
1700268551 混合遗传与粒子遗传的区别,在演化思想史上非常重要。达尔文在世时,每个人都相信遗传就是亲代特质的混合。(只有孟德尔例外,他的划时代论文于1865年发表,四年后又宣读了另一篇,可是他1868年当选修道院的“住持”,无暇再接再厉或宣传自己的研究成绩,学界到19世纪结束时才觉悟他的结论的意义。)苏格兰电机工程师弗莱明·杰肯(Fleeming Jenkin,1833~1885)1867年(当时是伦敦大学电机工程学教授)指出:光是混合遗传这个事实(译按:这是当时的流行意见),自然选择就不可能是值得考虑的演化机制。达尔文的反应是:(杰肯教授)“缺乏知识”。一个多世纪后,哈佛大学德裔美籍演化论大师迈尔(Ernst Mayr,1904~2005)对杰肯仍不同情。他于1982年评论道:杰肯《评〈物种起源〉》立论完全“基于当时物理科学家流行的偏见与误解。”然而,杰肯的论证却让达尔文十分忧虑。杰肯以一个船难寓言将他驳斥自然选择论的意旨发挥得淋漓尽致。话说船失事后,有一个白人船员漂流到一个有黑人土著的小岛上……
1700268552
1700268553 让我们假定这位白人拥有一切我们所知优于黑人的天赋;我们同意:在生存竞争的战场上,他享高寿的机会比土著酋长大多了;然而,即便如此,我们也无法推出这么一个结论:过了若干世代之后(暂不管确切的数字),岛民就会成为白人。我们的白人船难英雄可能会当上小岛的国王;为了生存,他会杀死许多黑人土著;他会有许多妻子,生许多孩子,而他的臣民中有许多男人因娶不到老婆而绝后……我们白人的优异天赋无疑会让他活到高寿,但是他一个人无论花多少世代也不可能将他臣民的后裔变成白人……在第一子代中,有许多聪明的年轻混血儿,平均说来比黑人优秀多了。我们也许可以期望以下几个世代国王宝座都由多少可说是黄皮肤的人占据;但是有人相信岛上整个族群都会逐渐变成白人吗,甚至黄人?或岛民会逐渐变得有活力、有勇气、有智巧、有耐心、有毅力、能自制?—我们的白人英雄不就是凭着那些天赋打败岛民、留下大量子裔的?!事实上这些质量正是在生存竞争中淬炼出来的,不是吗?(译按:19世纪的西方学者认为黄种人介于白种人与黑种人之间,处于黑人“进化”成白人的过渡阶段。)
1700268554
1700268555 请读者不要被杰肯论证中弥漫的白人优越意识岔开了注意力。在杰肯与达尔文的时代,这些种族偏见(racism)就像我们习以为常的物种(species)优越意识一样,“人”权、“人”的尊严、“人”命是神圣的等等,是有识之士随口就能大谈的东西。我们可以用比较中性的例子改写杰肯的论证。如果你混合白漆与黑漆,就会得到灰漆。可是将灰漆与灰漆混合,无法还原白漆与黑漆。混合漆的实验足以代表孟德尔遗传定律大白于世之前的遗传学,即使到了现在,通俗文化中仍然保留了“一加一除以二”的血液混合遗传观念。杰肯的论证其实就是“淹没”效应。依据混合遗传的假设,随着世代交替,少数个体的优异天赋必然会逐代“淹没”、冲淡。整体而言,个别性逐代抹杀,于是族群就“统一”了,根本没有自然选择的余地。而个体间的遗传差异是自然选择的原料。
1700268556
1700268557 这个论证你一定觉得非常可信,可是它不只是驳斥自然选择的论证,它还驳斥了遗传过程中无法抵赖的事实!它摆明了就不对,个体间的差异何曾在世代交替过程中消失?!我们彼此间的差异并不比我们祖父母那一辈还要小。个别差异仍然维持着,不多也不少。族群中有个别差异,足够自然选择运作。这是1908年德国医师温伯格(Wilhelm Weinberg,1862~1937)与英国数学家哈代(G. H. Hardy,1877~1947)殊途同归,以数学指出的事实(即高中生物学课本中的“哈—温定律”)。哈代是个不同流俗的学者,他当年(1919~1931)在牛津大学担任过几何学讲座教授,就待在我这个学院里(新学院,New College,14世纪末成立),他在我们学院的“打赌簿”上留下了一段佳话。原来他接受了一位同事半个便士的赌金(近1/480镑),拿全部家产赌“太阳明天仍然会升起”。但是以孟德尔“遗传粒子”(基因)理论完整地破解了杰肯的论证的,是费希尔等人领导的生物统计学派,他们奠定了现代族群遗传学的基础。在当时这颇令人尴尬,因为这批20世纪初期孟德尔信徒的领袖人物都自认为是反达尔文的(见最后一章)。费希尔等人证明了:要是在演化中变化的是各个遗传粒子(基因)的相对频率,而且任何一个生物个体中各个基因不是“有”就是“没有”,那么达尔文的自然选择理论就讲得通了,杰肯的问题因而漂亮地解决了。1930年,费希尔的经典著作《自然选择的遗传理论》出版之后,“新达尔文主义”(neo-Darwinism)之名便不胫而走。它的数字本质可不是个恰巧与遗传信息技术吻合的事实。搞不好生物遗传的数位性质是达尔文演化论必要的先决条件。
1700268558
1700268559 在我们的电子技术中,离散的、数字的位置每个都只有两种状态,依惯例以 0与1表示,当然你也可以用高与低、开与关、上与下来表示,只要它们不会混淆,而且它们的状态模式可以“读取”(传讯),以影响某个事物即可。电子技术使用各种材质储存以0与1编码的信息,例如磁盘、磁卡、打孔卡片、打孔带,以及智能芯片(其中包括大量微小的半导体单位)。
1700268560
1700268561 所有其他生物细胞,管它是柳树种子、蚂蚁还是什么的,主要以化学媒体储存信息,而不是电子媒体。这种媒体利用某些分子种类的“聚合”(polymerizing)性质储存信息。所谓聚合,就是分子彼此相连、成一长链,而且长度没有限制。聚合体有许多种。举个例子来说,聚乙烯是乙烯(一种小分子)聚合成的长链。淀粉与纤维素是聚合糖。有些聚合体是由一种以上的小分子聚合成的,与聚乙烯不一样。一旦聚合体有了异质性(长链由一种以上的分子聚合成的),理论上就可供信息技术利用。要是聚合体长链由两种小分子构成,它们就可以分别代表0与1,于是任何数量、任何种类的信息都可以储存在这种聚合体长链上,只要分子链够长。生物细胞利用的聚合体是多核苷酸(polynucleotides)。在生物细胞中多核苷酸有两个主要的家族,简称DNA与RNA。它们都是核苷酸组成的长链。DNA与RNA都是异质链,由四种不同的核苷酸组成。当然,这正是它们可以用来储存信息的理由。生物细胞的信息技术使用的不是二态码(0与1),而是四态码,按惯例以A、T、C、G代表(即四种核苷酸的英文缩写)。就原理来说,我们使用的二态信息技术与生物细胞的四态信息技术没什么不同。
1700268562
1700268563 我在第一章结束时说过,每个人体细胞用来储存信息的空间,足以容纳三四套《大英百科全书》(一套30册)。我不知道柳树种子或蚂蚁细胞的信息容量,但是它们应该与人类属于同一个数量级。一粒百合种子或蝾螈(salamander,一种两栖类)精子储存的信息量相当于60套《大英百科全书》以上。变形虫是原生生物,够“原始”了吧?可是变形虫有些物种,细胞核DNA足以储存相当于100套《大英百科全书》的信息。
1700268564
1700268565 令人惊讶的是:有些生物细胞的遗传信息,似乎只有1%实际派上用场,人类细胞就是一个例子,大约相当于一册《大英百科全书》。其他的99%为什么会在细胞中?没有人知道。我曾经指出它们也许是“寄生虫”,占那1%的便宜,它们搭便车进入细胞中,这个理论最近分子生物学家很感兴趣,为它取了个名字,叫它“自利的DNA”。细菌携带的遗传信息比人类细胞少得多,大约只有人类的千分之一,可是细菌的遗传信息也许每一笔都有用:没有什么空间容纳寄生虫。细菌的DNA“只”能容纳一本《新约》!
1700268566
1700268567 现代基因工程师已经发展出适当的技术,能够将《新约》或任何其他信息加载到细菌的DNA中。任何信息技术使用的符号、意义都可以任意规定,而DNA中有四个核苷酸“字母”(A、T、C、G),我们可以规定:以三个连续的核苷酸“字母”为一组(共有64种组合),每组都对应一个英文字母表中的字母,于是除了大、小写英文字母(共52个),还可对应12个标点符号。可是把《新约》写入细菌的DNA中,得花5个“人—世纪”,也就是说,要是一个人来做,5个世纪才做得完,我看不会有人想做的。不过,万一这工作完成了,以细菌的繁殖率而言,一天就能复制1000万本《新约》,要是人类能阅读细菌DNA中的字母多好!传教士的美梦也不过如此吧?可惜细菌DNA中的字母实在太小了,即使是1000万本《新约》,仍然能在一根大头针的“圆顶”上共舞。
1700268568
1700268569 计算机的内存一般区分为ROM与RAM两种。ROM就是“只读存储器”。严格一点儿说,就是“只能写入一次,可是能读许多次”的内存。制造时只要将以0与1编过码的信息“烧”(写)入内存内,就万事大吉了。内存这样“记下”的信息经久不变,爱读几次就读几次。至于RAM,它是既能读又能写的内存,因此ROM能做的事它也能做,它还能做ROM不能做的事。你随时可以将信息写入RAM中的任何地方,爱写几次就写几次。计算机里的内存,大部分是RAM。我现在在计算机上打出这些字句,它们全都先存到RAM里,我的文字处理程序也暂存在RAM里,但是理论上也可以将它烧在ROM里,从此不再改变它。ROM里存的是一组固定的标准程序,计算机在运算过程中会反复呼叫那些程序,你不能改变它们,即使真心想,也不成。
1700268570
1700268571 DNA就是ROM。它可以“读出”几百万次,但是只能“写入”一次—每个细胞里的DNA在细胞形成之初就(复制)组装完毕。任何一个人,身体里每个细胞的DNA都是“烧入”的,终身不变,偶尔发生罕见的随机退化倒不无可能。不过,它能复制。细胞一分裂,它就得复制一份。新生儿发育,增加的新细胞数以万计,每个新细胞的DNA都以先前细胞的DNA为模板,一五一十地复制出来,所有核苷酸(A、T、C、G)的序列都必须忠实无误。每个个体受孕的那一刻,一套新而独特的信息模式就“烧入”他的DNA的ROM中,此后终其一生摆脱不了那个模式。那套信息复制到他身体的每个细胞里(只有生殖细胞例外,他的每个生殖细胞都只得到半套信息,可是由于那半套是临时随机组合出来的,因此每个生殖细胞里的遗传信息都不相同)。
1700268572
1700268573 所有计算机内存,ROM也好,还是RAM,都有“地址”。就是说内存中每个位置都有一个卷标,通常是个数字,但是只要约定俗成,用什么当标签都无妨。重要的是:得分别每个记忆位置的地址与内容。每个位置有个地址。举例来说,我的计算机RAM里有65536个记忆位置,我刚刚随手敲进的两个字母现在登录在地址6446与6447里。以后那两个地址里的内容就不同了。每个位置里的内容,就是最近写入那个地址里的东西。ROM里每个位置也有地址与内容,只是一旦写入了任何东西,以后就无法更改了。
1700268574
1700268575 DNA是构成染色体的主要分子,它的结构像长的绳梯,平时长梯纠结缠绕,不容易看出头绪。不过DNA分子倒可比作计算机磁盘。我们身体每个细胞里的DNA都与ROM或计算机磁盘一样,上面的每笔信息都有地址卷标。用什么标记位置,数字也好,名字也好,都不重要。重要的是:我的DNA上任何一个特定位置,你的DNA上都有,丝丝入扣,它们地址相同。我的DNA地址321762的内容,也许与你的DNA地址321762的内容一样或不一样。但是我的地址321762在我的细胞中,与你的地址321762在你的细胞中,位置完全一样。这儿“位置”指的是某一特定染色体上的位置。至于这个染色体在各自的细胞中究竟位于什么地方,无关紧要。反正染色体悬浮在细胞核中,位置本就不是固定的。但是染色体长轴上的每个位置都有精确的地址,前后有一定的顺序,就像计算机磁盘也有精确的地址,即使整卷散乱在地面上,而不是整齐地卷起,凭地址也可以找到需要的段落。我们所有的人,所有“智人”,都有同样一套DNA地址,至于同一个地址是不是登录了同样的内容,则不一定。那是我们彼此不同的主要理由。
1700268576
1700268577 物种之间没有同样的一套地址。举例来说,黑猩猩有48个染色体,而我们只有46个。严格说来,不同物种不可能比较遗传信息的内容,因为地址对不上号。不过,亲缘关系密切的物种,像人与黑猩猩,染色体上许多“大块文章”里都有同样的内容,连组织都一样,我们很容易判定它们基本上是相同的,虽然它们并不使用同样的地址系统。确定不同个体属于同一物种的判断标准是:它们的DNA使用同一个地址系统。同一个物种的成员,都有同样数目的染色体,只有少数例外,而每一条染色体都有同样的地址、同样的地址顺序。不同个体间的差异,是那些地址中的内容(基因版本)不同导致的。
1700268578
1700268579 至于同一地址中的不同基因版本怎样造成个体间的差异,我现在要解释,但是我必须先强调:我所说的只适用于实行有性生殖的物种,而我们正是实行有性生殖的动物。我们的精子或卵子,每个都有23条染色体。一个人类精子中的任何一个基因地址,所有其他精子中都有对应的地址,不管是我的精子还是任何人的;卵子中也有。我身体里其他的细胞都有46条染色体—两套(成双)。那些细胞里同一个地址使用了两次。每一个细胞里第9号染色体都有两条,换言之,“9号染色体地址7230”有两个。这两个地址里的基因版本不一定相同,(同一物种)其他成员的也不一定相同。含有23条染色体的精子,是从含有46条染色体的细胞形成的,同一地址的两个基因每个精子只得到一个。至于是两个中的哪一个,就难说了,我们可以假定那与抛硬币的结果类似—服从随机定律。卵子也一样。结果,虽然同一物种的每个个体都使用同一套地址系统(暂不谈例外情况),以每个地址中的内容(基因版本)而言,每个精子与卵子都是独一无二的。卵子让精子受精后,就有了46条染色体;然后这个受精卵发育成胚胎,每个细胞中的46条染色体,都是受精卵里46条染色体的复本。
1700268580
1700268581 我说过,ROM(只读存储器)只有在第一次制造的时候才能写入,制造完成后就不能写入了,细胞里的DNA也一样,不过在复制的过程中,偶尔会发生随机错误。但是,整个物种的ROM—个别ROM的集合—可以写入有利于生存、繁殖的新指令。个体的存活、繁殖不是随机的事件,因此每个世代繁殖成功的个体都无异在物种基因库中写入了改良的存活指令。物种演化,主要是指世代间(同一地址)不同基因版本的比例变化。当然,在每个特定时间点上,每个基因版本都存在于个体的身体里。可是就演化而言,重要的是每个基因地址的不同基因版本“在族群中”的分布。地址系统一直没变,但是族群中不同基因版本的分布,在几世纪中会发生变化。
1700268582
[ 上一页 ]  [ :1.700268533e+09 ]  [ 下一页 ]