1700170409
1700170410
克里克对A、C、G和T做了同样的处理,他首先排除了AAA、CCC、GGG和TTT。然后他把剩下的60个词按每3个分为一组,每组包含3个相同的字母,字母的顺序是循环的。例如,ACT、CTA和TAC在同一组,因为在这一组中C总是在A后面,T总是在C后面,A总是在T后面;但是ATC,TCA和CAT就是另一组了。每组只有一个词会被保留下来,最后正好还剩下20个。而蛋白质编码表也刚好有20个由氨基酸组成的字母。一个4种字母的密码给出了一个20种字母的字母表。
1700170411
1700170412
克里克告诫人们不要把他的想法太当回事,但却徒劳。“在破译密码这事上,我们用来推测这套密码的论据和假设还不够充分,理论上讲,我们不应对它抱有太大的信心。我们提出这个推论,是因为它能从合理的物理学假设出发,以一种简洁的方式给出了‘20’这个神奇的数字。”但是,双螺旋结构一开始也并没有获得什么证据方面的支持。兴奋之情日渐高涨。在此之后的5年里,所有人都认为这个推论是正确的。
1700170413
1700170414
但是空谈理论时代已然过去。1961年,当所有人都还在琢磨克里克推论的时候,马歇尔·尼伦伯格(Marshall Nirenberg)和约翰·马特伊(Johann Matthaei)通过一种简单的方法破译了这个密码表中的一个“词”:只用U(尿嘧啶,相当于DNA中的T)制造出一段RNA链,并将其扔进氨基酸溶液中。在这个溶液中,核糖体将大量的苯丙氨酸拼接在一起,制造出了一个蛋白质。密码表中的第一个词就这样被破译了:UUU代表苯丙氨酸。“无逗号密码”理论终究还是错了。过去我们认为它的伟大之处在于,它不会出现所谓的移码突变,即一个字母的丢失使得后面的一切都失去了意义。然而,大自然却选用了另一种方法,虽然不那么考究,但却更能兼容其他错误。它出现了很多重复:多个三字母词表达的均是同一个意思。[7]
1700170415
1700170416
到了1965年,随着全部遗传密码的破译,开启了现代遗传学的时代。那些在20世纪60年代的前沿性突破,已然成为90年代的常规,见怪不怪。因此,在1995年重新回顾阿奇博尔德·加罗德研究的那些早已过世的黑尿病患者时,科学可以明确地告诉我们是在哪个基因上发生了什么拼写错误才导致他们患病的。这个故事是20世纪遗传学的一个缩影。别忘了,黑尿病是一种非常罕见但不太危险的疾病,通过调整饮食就可以轻易地治好。因此,多年来科学家都没有再去研究它。1995年,鉴于其在遗传学历史上的重要地位,两名西班牙人展开了对它的研究。他们制造出了一种曲霉菌(一种真菌)的突变体,这种突变体在苯丙氨酸存在的情况下会大量累积紫色色素,即尿黑酸。与加罗德的推测一致,这种突变体中有一种功能缺陷的蛋白质,即尿黑酸双加氧酶。通过用特殊的酶去分解真菌基因组,这两名西班牙人找出了不同于正常霉菌基因组的片段,并读取了其中的密码,并最终找到了出问题的基因。之后他们在人类基因库中进行搜索,期望找到与真菌基因组中的这个基因足够相似的人类基因。他们找到了。在3号染色体的长臂上,有一段DNA字母序列,与那个真菌基因有52%的相似性。从黑尿病患者体内找到这个基因,并把它和正常人体内的同一基因进行比对,结果他们找出了致病的关键:两者的基因在第690个字母或第901个字母上与正常基因有所不同。每个患者都是因为这两个字母中的一个出了错,从而导致蛋白质无法发挥正常功能。[8]
1700170417
1700170418
这个基因只是众多普通基因的一个缩影,它们在身体的既定部位日复一日地做着相同的工作,一旦出了问题,就会引发一种疾病。它不会给人带来惊奇,也没有独特之处。它与智力或同性恋没有关系,它不能告诉我们生命的起源,它不是自私的基因,它不能违背孟德尔定律,它不会致死或致残。实际上,地球上的每一种生物都有完全相同的基因——即使是面包霉菌也有,并且做着与人类完全相同的事情。然而,编码尿黑酸双加氧酶的基因无愧于它在历史上所占的一席之地,因为它的故事是整个遗传学发展的缩影。这个不起眼的小基因展示出了一种足以让格雷戈尔·孟德尔眩晕的美。因为是它让抽象的孟德尔理论有了具体、实在的表达:一个关于微小的、缠绕在一起的、相互配对的双螺旋故事,关乎那些由四字母组成的遗传密码,也昭示了所有生命在化学上的统一性。
1700170419
1700170420
[1] 钦定讲座教授(Regius Professor)是由英国最高统治者授予的一项至高无上的荣誉,用以表彰那些有利于经济增长和提高生产力的学者。在过去,此席位一般是在创立教授职位时产生,并以皇家赞助人的身份授予,是对英国大学里优异的学术表现和大学科研对现实世界的影响力的一种认可。——译者注
1700170421
1700170422
1700170423
1700170424
1700170426
基因组:生命之书23章 4号染色体 命运
1700170427
1700170428
先生,您说的这些只不过是科学上的加尔文主义。
1700170429
1700170430
——一名苏格兰士兵在听完讲座后对威廉·贝特森说[1]
1700170431
1700170432
打开任何一份人类基因组的目录,你所面对的不是人类到底有多少潜能,而是一个疾病清单。这些疾病大多是以一两个不知名的中欧医生的名字所命名的。好比尼曼匹克症(Niemann-Pick disease),沃夫-贺许宏氏症候群(Wolf-Hirschhorn syndrome)。给人的印象是,基因就是导致疾病的。有关基因的网站常以这种方式来发布前沿科学报道:“发现了有关精神类疾病的新基因”,“发现了导致早发性肌无力的基因”,“肾癌基因被成功分离”,“自闭症与血清素转运蛋白基因有关”,“发现了一个新的阿尔茨海默病基因”,“发现了强迫行为背后的遗传机理”。
1700170433
1700170434
然而,用基因引起的疾病来定义基因,就像用身体器官引起的疾病来定义器官一样,很是荒唐。好像是在说:肝脏的功能是导致肝硬化,心脏的功能是得心脏病,大脑的功能是导致中风。基因名录之所以如此,不是因为我们对基因很了解,相反,这反映出了我们对于基因的无知。事实上,我们对某些基因的了解仅限于它们功能失常时会导致某种特定的疾病。而对于一个基因来说,事实上这只是冰山一角,且极具误导性。这只会使得人们想当然地认为:“某人拥有沃夫-贺许宏氏症候群基因。”大错特错!颇为讽刺的是,除了那些患有沃夫-贺许宏氏症候群的人,我们每个人都有沃夫-贺许宏基因。他们之所以得这种病,正是因为他们没有这个基因。对我们其他人来说,基因呈现的是一种积极,而非消极的作用。患病是因为基因发生了突变,而不是因为有了这个基因。
1700170435
1700170436
沃夫-贺许宏氏症候群特别罕见,且造成的后果也尤为严重。也就是说,其基因的作用非常关键,以至于患者常常早逝。然而,位于4号染色体上的这个基因,实际上是所有“致病”基因中最为著名的,因为该基因还会导致另外一种非常不同的疾病:亨廷顿舞蹈症。基因突变会导致亨廷顿舞蹈症,而该基因完全缺失则会导致沃夫-贺许宏氏症候群。我们对基因在日常生活中的作用知之甚少,但我们现在对基因如何、为何出错,错误从何而来以及对身体有何影响有了极为深入的了解。这个基因包含一个一再重复的“词”:CAG,CAG,CAG,CAG……这种重复有时是6次,有时是30次,有时超过100次。人的命运、神智和生命,都被这种重复所束缚。如果这个“词”重复不超过35次,你就会没事,而我们大多数人都有大约10到15次的重复。如果“词”重复了39次及以上,你就会在步入中年之时慢慢开始失去平衡,生活变得越来越不能自理,最后过早地死去。这种衰退开始于智力的轻微衰退,然后是四肢抽搐,最后令人陷入深度抑郁,偶尔出现幻觉和妄想。毫无疑问,这种疾病是无法治愈的,但这个过程需要耗费15到25年的时间,没有比这更为悲惨的了。事实上,一旦家族里有人出现了这种疾病的早期症状,那种恐惧感对于很多尚未得病的人来说,也是很糟糕的。毕竟,等待疾病袭来的时候,那种紧张和压力,是毁灭性的。
1700170437
1700170438
致病的根源在于基因,和其他无关。要么你带有亨廷顿舞蹈症的突变,会得病;要么你没有携带亨廷顿舞蹈症的突变,不会得病。这是加尔文做梦也没有想到的决定论、宿命论和命运论。乍一看,这似乎是基因起主导作用的终极证明,我们对此无能为力。不管你是吸烟还是服用维生素片,不管你是健身还是天天窝在沙发上看电视,亨廷顿舞蹈症发病的年龄完全取决于CAG这个“词”在一个基因的某个位置上重复出现的次数,一点通融的余地都没有。如果一个人带有39次重复,到75岁时便有90%的概率患上痴呆症,且大概会在66岁时首次发病;如果带有40次重复,那么平均来说会在59岁时发病;如果带有41次重复,54岁时发病;如果带有42次重复,37岁时发病;以此类推,那些带有50次重复的人,会在大约27岁时发病。这样打个比方:如果你的染色体长得能够绕赤道一周,两三厘米的差别就足以决定你到底是健康还是精神错乱。[2]没有哪个占星术能达到这样的精度。无论是弗洛伊德的、马克思主义的、基督教的还是泛灵论的人类因果关系理论,都从未达到如此精确的境地。无论《旧约圣经》中的先知、古希腊凝视内心的圣人,还是博格诺里吉斯(Bognor Regis)码头上拿着水晶球占卜的吉卜赛人,都从未假装自己有能力可以告诉人们生活将会在什么时候被毁掉,更不用说去做正确的预测了。我们面对的是一个可怕的、残酷的和不可改变的预言。你的基因组中有10亿个由3个字母组成的“词”。然而,这个“词”的重复次数,就能决定我们正常与否。
1700170439
1700170440
1967年,亨廷顿舞蹈症夺去了民谣歌手伍迪·格思里(Woody Guthrie)的生命,一时甚嚣尘上。1872年,该病被一位名叫乔治·亨廷顿(George Huntington)的医生在长岛东端首次诊断出来。他注意到这个病似乎存在着家族遗传。后续的研究显示,长岛病例起源于新英格兰的一个大家族。在这个大家族的12代人中,出现了超过1000个患者。他们都是1630年从萨福克郡移民来的两兄弟的后代。1693年,可能是因为这种疾病太过恐怖,他们的几个后代在塞勒姆被当作女巫给烧死了。但由于这种突变导致的病症只有步入中年时才得以显现出来,而那时大家都已成家生子,所以致病的基因突变没有被自然选择给淘汰掉。事实上,在一些研究中,那些携带突变的人似乎比他们未患病的兄弟姐妹生下了更多的后代。[3]
1700170441
1700170442
亨廷顿舞蹈症是人类发现的第一个完全显性的人类遗传疾病。这意味着它不像黑尿病那样必须得有两个分别来自父母的突变基因才能患病,只要一个突变就足矣。如果遗传自父亲,则病症似乎会更糟,而且随着父亲年龄的增长,重复次数的增多,突变的增长往往会变得更加严重。
1700170443
1700170444
20世纪70年代末,一位意志坚定的女性决心要找出亨廷顿舞蹈症的致病基因。在伍迪·格思里死于这种疾病后,他的遗孀成立了一个抗亨廷顿舞蹈症委员会。一位名叫米尔顿·韦克斯勒(Milton Wexler)的医生也加入了她的行列,他的妻子和妻子的3个兄弟都患有这种疾病。韦克斯勒的女儿南希(Nancy)知道自己有50%的概率带有这种致病突变,便义无反顾地踏上了对这种基因的寻找之旅。有人劝她不要自找麻烦,说此事犹如大海捞针,是不可能找到这种基因的,劝她等上几年,等科技进步到有可能实现的那一天再说。“但是,”她写道,“如果你也有亨廷顿舞蹈症,就不会再等了。”在看到委内瑞拉医生阿梅里科·内格雷特(Americo Negrette)的报告后,她于1979年飞往委内瑞拉,访问了马拉开波湖畔的三个分别名为圣路易斯(San Luis)、巴兰基塔斯(Barranquitas)和拉古内塔(Laguneta)的村庄。实际上,马拉开波湖是一个巨大的、几乎被陆地包围的海湾,位于委内瑞拉的最西端,在梅里达山脉(Cordillera de Merida)的后面。
1700170445
1700170446
该地区有一个亨廷顿舞蹈症发病率很高的大家族。据家族记载,该病来源于18世纪的一名水手。韦克斯勒成功地将疾病家族史追溯到了19世纪初一位名叫玛丽亚·康塞普西翁(Maria Concepcion)的女性身上。这位女性曾住在普韦布洛斯德阿瓜(Pueblos de Agua),那是一个由建在水面上的房子所组成的村落。作为一个子嗣颇多的妇人,她的家族已传承了8代,共有1.1万人,在1981年的时候,仍有9000人还活着。在韦克斯勒初次访问之时,就有不少于371人患有亨廷顿舞蹈症,另有3600人至少有1/4的患病可能,因为他们的祖父母中至少有一人已表现出了症状。
1700170447
1700170448
韦克斯勒有着非凡的勇气,要知道她本人就可能携带有致病突变。“看着这些生气勃勃的孩子们,真让人崩溃,”她写道[4],“尽管贫穷,尽管不识字,尽管男孩子们在湍急的湖中乘着小船捕鱼既危险又劳累,尽管那么小的女孩就要操持家务并照顾生病的父母,尽管残酷的疾病夺走了他们的父母、祖父母、姨妈、叔伯和表亲,他们仍满怀希望、忘我地生活,直到疾病来袭。”
1700170449
1700170450
韦克斯勒开始做着大海捞针般的繁重工作。首先,她采集了500多人的血样,过程可没那么好受——又热又吵。接着,她把血样送到吉姆·古塞拉(Jim Gusella)在波士顿的实验室。通过随机选择一些DNA片段,并与遗传标志物进行比对,他希望以此找到致病基因。对于患者和正常人而言,所选的这些随机片段或会有所区别,或没有区别。最终,幸运之神招手了。到1983年年中,他在离致病基因很近的地方,分离出了一个标记,并将其定位在了4号染色体短臂的顶端。古塞拉知道这个基因就在基因组3/1 000 000的序列里。大功告成了吗?还没那么快。这个基因所在的区域长达100万个字母。范围是缩小了些,但仍有很大的工作量。8年过去了,该基因依然迷雾重重。“这项任务极其艰巨,”韦克斯勒写道,听起来就像是个维多利亚时代的探险家所说的,[1]“在4号染色体顶端这片荒凉的地带探索,环境极其凶险。过去的8年,俨然就是在攀登珠穆朗玛峰。”
1700170451
1700170452
坚持不懈的努力终于得到了回报。1993年,终于发现了这个基因。人们对它进行解读并找到了致病的突变。随后该基因所编码的蛋白被分离了出来,并命名为亨廷顿蛋白。基因中间重复的CAG这个“词”会使得蛋白质的中部含有一长串谷氨酰胺(在基因语言里,CAG特指谷氨酰胺)。而且,对亨廷顿舞蹈症来说,谷氨酰胺越多,发病年龄就越小。[5]对此疾病进行这般解释,似乎很没有说服力。如果亨廷顿基因有问题,为何它在病人生命的前30年里没有异常呢?显然,突变型的亨廷顿蛋白逐渐聚集成块。就像阿尔茨海默病和疯牛病那样,正是这种黏糊糊的蛋白质在细胞内的聚集导致了细胞的死亡,也许是因为它诱发了细胞自杀。在亨廷顿舞蹈症中,这种情况主要发生在大脑专用的运动控制室中。其结果是,会出现运动失调或失控。[6]
1700170453
1700170454
最令人意想不到的是,CAG这个词的一再重复并不只限于亨廷顿舞蹈症。另外还有5种神经系统疾病,也是由所谓的“CAG发生了错误的重复”所引起的,不过是发生在完全不同的其他基因里,比如小脑共济失调。甚至有一份奇怪的研究报告称,将一个长的CAG重复序列插入到小鼠体内一个随机的基因之后,会导致类似亨廷顿舞蹈症的迟发性神经疾病。因此,无论CAG重复出现在哪个基因中,都可能导致神经系统疾病。此外,还有其他一些神经退化的疾病也是由一些词的一再重复所引起的,这些重复往往以C开头,以G结尾。已发现有6种病是由CAG所导致的。此外,在X染色体起始处的CCG或CGG一旦重复超过200次,就会导致“脆性X综合征”。这是一种很常见的痴呆症,不同病人之间症状差别很大。在正常人体内,这种重复一般少于60次,而在病人体内,常常超过1000次。如果CTG在19号染色体上的一个基因中重复50到1000次,就会导致强直性肌营养不良。有十几种人类疾病都是由三字母词重复过多所引起的,它们被统称为多聚谷氨酰胺病。在所有病例中,过长的蛋白质都倾向于积累成无法正常降解的蛋白质块,进而导致它所在的细胞凋亡。这些疾病有不同症状,只是因为在身体的不同部位上,基因的表达不太一样。[7]
1700170455
1700170456
除了表示谷氨酰胺之外,这个以C开头、以G结尾的“词”,还有什么特别之处呢?一种被称为“预期效应”的现象给了人们一些启发。人们早就知道,那些患有严重亨廷顿舞蹈症或脆性X综合征的人,其子女发病时间一般早于父母,且病情也更为严重。预期效应意味着,父母体内的重复越多,复制到下一代时,所增加的长度就越长。我们知道,这些重复片段形成了一种叫作发夹的DNA小环。DNA会自身回折,形成一个像发夹一样的结构,把以C开头、以G结尾的单词中的字母C和字母G在“发夹”中连接了起来。当DNA复制时,“发夹”被打开,复制过程偶尔会出个小错,就把更多的词插入到了DNA里。[8]
1700170457
1700170458
打个简单的比方,也许会有助于理解。如果把CAG这个词重复6次——CAG,CAG,CAG,CAG,CAG,CAG,你会很容易数得一清二楚。但如果重复36次——CAG,CAG,CAG,CAG,CAG,CAG,CAG,CAG,CAG,CAG,CAG,CAG,CAG,CAG,CAG,CAG,CAG,CAG,CAG,CAG,CAG,CAG,CAG,CAG,CAG,CAG,CAG,CAG,CAG,CAG,CAG,CAG,CAG,CAG,CAG,CAG,恐怕就会数错了。DNA也是如此。重复次数越多,复制机器在复制DNA的时候就越有可能插入一个额外的重复。手指稍微一滑,就忘了自己数到哪儿了。另一种(或可能是附加的)解释是,被称为错配修复的系统主要用于查出较小的差误,但像词重复这么大的差误太过严重,反而无能为力。[9]这也许可以解释为什么这些疾病会在一定年龄之后才发病。伦敦盖伊医院的劳拉·曼吉亚里尼(Laura Mangiarini)制造出了一只转基因小鼠,携带有亨廷顿基因片段,其中包含100多个重复序列。随着小鼠的长大,除了后脑里负责运动机能的小脑外,其他所有器官中该基因的重复次数都增加了,最多的增加了10次。一旦小鼠学会走路,小脑里的细胞就不再需要改变了,所以它们不再进行分裂。当细胞和基因分裂时,就会产生复制错误。在人体内,小脑里的重复次数会减少,尽管在其他组织中重复次数会增加。在那些制造精子的细胞里,CAG的重复次数逐渐增加,这就解释了为什么亨廷顿舞蹈症的发病与父亲的年龄有关:年龄越大的父亲,其儿子发病年龄越早,病情越严重。顺便提一句,现在已经知道,在整个基因组中,男性的突变率大约是女性的5倍。这是因为男性终其一生都在不断提供新鲜的精子细胞,而基因的不断复制对此是必需的。[10]
[
上一页 ]
[ :1.700170409e+09 ]
[
下一页 ]