1700170135
1700170136
每章均包含数千个故事,每个故事就是一个基因。
1700170137
1700170138
每个故事都由不同的段落组成,即外显子。段落之间插播广告,而这些广告就是内含子。
1700170139
1700170140
每个段落均由单词组成,此单词就是密码子。
1700170141
1700170142
每个单词是用字母写就的,此字母就叫作碱基。
1700170143
1700170144
书中有10亿个单词,相当于本书厚度的5千多倍,或者说是《圣经》的800倍。如果每天以每秒一个单词,每天读8小时的速度来读取基因组,那将需要读上100年。如果把人类基因组写下来,每个字母一毫米,则总长度堪比多瑙河。这是一个巨型文档,一部浩瀚的书,一张冗长的配方,可是竟能把它们全都置于一个比大头针针尖还小的细胞微核之中。
1700170145
1700170146
严格来说,将基因组比作一本书并非隐喻。基因组真的是一本书。书是一种数据信息,以线性、一维和单向形式编写的。小小的字母符号按特定的组合顺序转译为有意义的代码并汇编成册,即为书。基因组也是如此。仅有的区别在于,所有的英文书都是从左至右读的,而基因组的某些部分是从左至右读的,某些部分又是从右至左读的,不过绝不至于双向同时都在读。
1700170147
1700170148
顺便说一句,在本段之后,你将不会在本书中看到令人烦腻的“蓝图”一词,原因有三。首先,只有架构师和工程师才使用蓝图一词,而且即便是他们,在计算机时代也都早已弃用蓝图一词了,而我们全在使用“书”这个词;其次,相对基因而言,蓝图是个非常糟糕的类比。因为蓝图是二维图,而非一维数字编码;再者,对于遗传学而言蓝图一词太过文绉绉,因为蓝图中的每个部分都与机器或建筑物上的一个部分相对应。毕竟,配方中的辞藻无论多么华丽,也不会真的让蛋糕变得别有风味。
1700170149
1700170150
英文书是用26个字母组成的单词所书写的,单词长短不一。而基因组则全然以3个字母的单词进行书写,且仅使用了4个字母:A,C,G和T(分别代表腺嘌呤,胞嘧啶,鸟嘌呤和胸腺嘧啶)。此外,它们并非写在平面纸张上,而是写在由糖和磷酸构建的长链上。这种长链被称为DNA分子,碱基作为侧梯连接在上面。每条染色体是一对(非常)长的DNA分子。
1700170151
1700170152
基因组是一本非常精巧的书,在适当的条件下它既可以复印,也可以自读。复印即为复制,自读则是翻译。之所以可以复制,是因为这四个碱基的新奇特性:A总是与T配对,G总是与C配对。因此,单链DNA可以将T与A,A与T,C与G以及G与C通过互补配对的方式来进行自我复制。实际上,DNA的通常状态是那著名的双螺旋,由原始链和互补配对链相互缠绕而成。
1700170153
1700170154
因此,复制互补链即可得到原文内容。在复制过程中,序列ACGT变为TGCA,再复制便又转录回原来的ACGT了。这使得DNA可以无限复制下去,却仍携带着同一套的信息。
1700170155
1700170156
翻译稍微复杂一点。首先,通过相同的碱基配对过程将一个基因的文本转录成一份副本,但是这份副本并非由DNA而是由RNA(一种略有不同的化学物质)构成的。RNA也可以携带线性密码,除了用U(尿嘧啶)代替T之外,它使用与DNA一样的字母。该RNA副本称为信使RNA,通过切除所有内含子而将所有外显子拼接在一起(见上文)。
1700170157
1700170158
之后,信使RNA结合被称为核糖体的微型分子机器,而该机器自身的一部分亦是由RNA构成的。核糖体沿着信使RNA进行移动,将三联密码子依次翻译成另一份字母表。这份字母表由20种不同氨基酸组成,每种氨基酸均由被称为转录RNA的不同分子携带转运而来。每个氨基酸都以与密码子相同的顺序首尾相连,形成一条链。翻译完全部信息后,氨基酸链会依据其序列折叠成独特的形状,成为现今所称的蛋白质。
1700170159
1700170160
从头发到激素,人体内几乎所有东西都是由蛋白质构成或制成的。每个蛋白质都是被翻译出来的基因。特别值得一提的是,人体的化学反应被称为酶的蛋白质所催化。甚至连DNA和RNA分子本身的加工,拷贝、纠错和组装(复制和翻译),都是借助蛋白质来完成的。蛋白质还通过将自身附着在基因上游附近的启动子和增强子序列上,从而调节基因的开关。不同基因在人体的不同部位被开启。
1700170161
1700170162
复制基因,有时会出错。有时会漏掉一个字母(碱基)或插入错误的字母。整个句子或段落有时会出现重复,丢失或次序颠倒,这称为突变。许多突变既无害也无益,好比,如若将一个密码子更改为具有相同氨基酸“含义”的另一个密码子。要知道,共有64个不同的密码子,但只有20种氨基酸,因此许多DNA“单词”便具有相同的含义。人类的每个世代会累积约100个突变,考虑到人类基因组中有超过100万个密码子,这似乎也并不算多。然而,要是出现在错误的地方,即便只有一个突变,都可能是致命的。
1700170163
1700170164
凡事均有例外,人类基因亦如此。并非所有人类基因都能在这23对主要染色体上找到,有少量的基因存在于被称为线粒体的膜囊之中,并且很可能自线粒体还是非寄生的细菌以来,便一直如此;并非所有基因都是由DNA组成的,某些病毒改用的是RNA;并非所有的基因都能生产出蛋白质,一些基因被转录成RNA,但没有被翻译成蛋白质。这些RNA要么作为核糖体的一部分,要么作为转运RNA而直接发挥作用;并非所有的反应都由蛋白质来催化,有少数反应可由RNA催化;并非所有的蛋白质都来自单个基因,有些是由多个基因共同合成的;并非所有的64个三联密码子都能转译为氨基酸,其中有3个负责传达停止信号;最后,并非所有的DNA都能形成基因,DNA中的大部分是重复或随机的杂乱序列,很少或从未被转录,是所谓的垃圾DNA。
1700170165
1700170166
了解完这些,人类基因组之旅就可以正式开篇了。
1700170167
1700170168
[1] 最新科学研究显示人类基因组约有2万到2.5万个基因。——译者注
1700170169
1700170170
1700170171
1700170172
1700170174
基因组:生命之书23章 1号染色体 生命
1700170175
1700170176
一死一生,川流不息;
1700170177
1700170178
灭亡之后,振兴继之;
1700170179
1700170180
一祸一福,起伏相寻;
1700170181
1700170182
有如水中,忽生泡影;
1700170183
1700170184
自起自灭,幻化无穷。
[
上一页 ]
[ :1.700170135e+09 ]
[
下一页 ]