1700170147
1700170148
顺便说一句,在本段之后,你将不会在本书中看到令人烦腻的“蓝图”一词,原因有三。首先,只有架构师和工程师才使用蓝图一词,而且即便是他们,在计算机时代也都早已弃用蓝图一词了,而我们全在使用“书”这个词;其次,相对基因而言,蓝图是个非常糟糕的类比。因为蓝图是二维图,而非一维数字编码;再者,对于遗传学而言蓝图一词太过文绉绉,因为蓝图中的每个部分都与机器或建筑物上的一个部分相对应。毕竟,配方中的辞藻无论多么华丽,也不会真的让蛋糕变得别有风味。
1700170149
1700170150
英文书是用26个字母组成的单词所书写的,单词长短不一。而基因组则全然以3个字母的单词进行书写,且仅使用了4个字母:A,C,G和T(分别代表腺嘌呤,胞嘧啶,鸟嘌呤和胸腺嘧啶)。此外,它们并非写在平面纸张上,而是写在由糖和磷酸构建的长链上。这种长链被称为DNA分子,碱基作为侧梯连接在上面。每条染色体是一对(非常)长的DNA分子。
1700170151
1700170152
基因组是一本非常精巧的书,在适当的条件下它既可以复印,也可以自读。复印即为复制,自读则是翻译。之所以可以复制,是因为这四个碱基的新奇特性:A总是与T配对,G总是与C配对。因此,单链DNA可以将T与A,A与T,C与G以及G与C通过互补配对的方式来进行自我复制。实际上,DNA的通常状态是那著名的双螺旋,由原始链和互补配对链相互缠绕而成。
1700170153
1700170154
因此,复制互补链即可得到原文内容。在复制过程中,序列ACGT变为TGCA,再复制便又转录回原来的ACGT了。这使得DNA可以无限复制下去,却仍携带着同一套的信息。
1700170155
1700170156
翻译稍微复杂一点。首先,通过相同的碱基配对过程将一个基因的文本转录成一份副本,但是这份副本并非由DNA而是由RNA(一种略有不同的化学物质)构成的。RNA也可以携带线性密码,除了用U(尿嘧啶)代替T之外,它使用与DNA一样的字母。该RNA副本称为信使RNA,通过切除所有内含子而将所有外显子拼接在一起(见上文)。
1700170157
1700170158
之后,信使RNA结合被称为核糖体的微型分子机器,而该机器自身的一部分亦是由RNA构成的。核糖体沿着信使RNA进行移动,将三联密码子依次翻译成另一份字母表。这份字母表由20种不同氨基酸组成,每种氨基酸均由被称为转录RNA的不同分子携带转运而来。每个氨基酸都以与密码子相同的顺序首尾相连,形成一条链。翻译完全部信息后,氨基酸链会依据其序列折叠成独特的形状,成为现今所称的蛋白质。
1700170159
1700170160
从头发到激素,人体内几乎所有东西都是由蛋白质构成或制成的。每个蛋白质都是被翻译出来的基因。特别值得一提的是,人体的化学反应被称为酶的蛋白质所催化。甚至连DNA和RNA分子本身的加工,拷贝、纠错和组装(复制和翻译),都是借助蛋白质来完成的。蛋白质还通过将自身附着在基因上游附近的启动子和增强子序列上,从而调节基因的开关。不同基因在人体的不同部位被开启。
1700170161
1700170162
复制基因,有时会出错。有时会漏掉一个字母(碱基)或插入错误的字母。整个句子或段落有时会出现重复,丢失或次序颠倒,这称为突变。许多突变既无害也无益,好比,如若将一个密码子更改为具有相同氨基酸“含义”的另一个密码子。要知道,共有64个不同的密码子,但只有20种氨基酸,因此许多DNA“单词”便具有相同的含义。人类的每个世代会累积约100个突变,考虑到人类基因组中有超过100万个密码子,这似乎也并不算多。然而,要是出现在错误的地方,即便只有一个突变,都可能是致命的。
1700170163
1700170164
凡事均有例外,人类基因亦如此。并非所有人类基因都能在这23对主要染色体上找到,有少量的基因存在于被称为线粒体的膜囊之中,并且很可能自线粒体还是非寄生的细菌以来,便一直如此;并非所有基因都是由DNA组成的,某些病毒改用的是RNA;并非所有的基因都能生产出蛋白质,一些基因被转录成RNA,但没有被翻译成蛋白质。这些RNA要么作为核糖体的一部分,要么作为转运RNA而直接发挥作用;并非所有的反应都由蛋白质来催化,有少数反应可由RNA催化;并非所有的蛋白质都来自单个基因,有些是由多个基因共同合成的;并非所有的64个三联密码子都能转译为氨基酸,其中有3个负责传达停止信号;最后,并非所有的DNA都能形成基因,DNA中的大部分是重复或随机的杂乱序列,很少或从未被转录,是所谓的垃圾DNA。
1700170165
1700170166
了解完这些,人类基因组之旅就可以正式开篇了。
1700170167
1700170168
[1] 最新科学研究显示人类基因组约有2万到2.5万个基因。——译者注
1700170169
1700170170
1700170171
1700170172
1700170174
基因组:生命之书23章 1号染色体 生命
1700170175
1700170176
一死一生,川流不息;
1700170177
1700170178
灭亡之后,振兴继之;
1700170179
1700170180
一祸一福,起伏相寻;
1700170181
1700170182
有如水中,忽生泡影;
1700170183
1700170184
自起自灭,幻化无穷。
1700170185
1700170186
——《人论》(亚历山大·蒲柏)
1700170187
1700170188
万物伊始,便有这么一个“词”。它携带着自身信息,自我复制,永不停歇,令大海焕发新颜。这个“词”揭示了如何重排化学物质,以便在无序之中因势而动,得以生存。它让地表从尘土飞扬的地狱变成了翠绿的天堂。这个“词”最终大放异彩,聪慧过人,制造了划时代的装置——人脑,而人脑得以发现并意识到这个“词”的存在。
1700170189
1700170190
每念及于此,我便头脑一团糨糊。在40亿年的地球历史中,我很幸运能够活在今天。在500万个物种里,我很幸运生下来便是一个有意识的人。地球上有60亿人口,我有幸能够出生于发现这个“词”的国家。这个“词”到底是什么呢?从地球历史、生物和地理的角度来看,在我出生前仅5年的时候,在距我仅200英里[1]的地方,两位我的同类,发现了DNA结构,并揭示了最伟大、最简单、最令人咂舌的宇宙奥秘。你可以嘲笑我的狂热,可以认为我对此缩写词的热衷实在是有点太过了,分明就是一位荒谬的唯物主义者。但是,请随我回到生命的源头,我希望能让你领略到这个“词”的无限魅力。
1700170191
1700170192
1794年,博学的诗人兼医生伊拉斯谟·达尔文(Erasmus Darwin)曾问道[1],“早在动物诞生之前,陆地和海洋或许就已经布满各类植物。而且有的动物出现得早,有的动物出现得晚。据此,我们是否可以推测出所有的有机生命均起源于同一种有生命的丝状物?”这在当时可是惊人之语,他不仅提出了所有有机生命都具有相同起源这一大胆推测,比他的孙子查尔斯(Charles)有关该主题的书早了65年,还奇怪地使用了“丝状物”一词。生命的奥秘确实就在一条细丝里。
1700170193
1700170194
然而,一条丝状物是如何造出生命的呢?生命很难定义,但它有两种截然不同的技能:复制能力和建立秩序的能力。生物产生与自己相似的副本:兔子诞下兔子,蒲公英繁殖蒲公英。不过,兔子的作用远不止于此。它们吃草,将其转化为兔肉,并以某种方式在随机而混乱的世界里构筑有序而复杂的身体。这并没有违背热力学第二定律——在封闭的系统中,一切都会从有序向无序发展,不过兔子不是封闭的系统。兔子通过消耗大量能量,构建起有序而复杂的身体堡垒。用埃尔温·薛定谔(Erwin Schrödinger)的话来说,生物从环境中“汲取秩序”。
1700170195
1700170196
生命这两个特征的关键是信息。有了配方(构筑新个体所需的信息),自我复制成为可能。兔子的卵子携带着如何组装新生兔子的指令。不过,通过新陈代谢建立秩序的能力还是得仰仗信息,是它发号指令来构建和维持机体并建立秩序的。就像按照蛋糕配方制作出成品那样,一只具有繁殖和新陈代谢能力的成年兔子,在它还是有生命的丝状物时就已预设好了。这一想法可以追溯到亚里士多德(Aristotle),他曾说:鸡蛋会孵化成鸡,橡树种子会长成橡树。亚里士多德对信息论的初步理解已被化学和物理学湮没多年,伴随着现代遗传学的发展,得以重见天日。马克斯·德尔布吕克(Max Delbruck)开玩笑地说,因DNA的发现,应给这位希腊圣贤追授诺贝尔奖。[2]
[
上一页 ]
[ :1.700170147e+09 ]
[
下一页 ]