1700237509
1700237510
现在你明白了吧,说一个物种基因组有多大,就是问这个物种有多少张“扑克牌”,也即多少个碱基对。比如乙型肝炎病毒基因组有多大啊?3.2Kb,也就是3200对;大肠杆菌基因组有多大啊?4.6Mb,也就是400多万对;果蝇(一种苍蝇)的基因组有多大啊?137Mb,也就是1.37亿对;水稻的基因组有多大啊?460Mb,也就是4.6亿对;大豆的基因组有多大啊?1Gb,大约是10亿对;那小麦的基因组呢?16Gb,也就是160亿对。至于人类,刚才已经讲过了,大约是3Gb,也就是30亿个碱基对。不光是人类,大部分哺乳动物也都是在3Gb左右,而鸟类的基因组大部分是1Gb左右,至于鱼类、两爬类还有昆虫们,它们的基因组大小范围就非常广阔了,从几百Mb到几十Gb都有,还真不容易一概而论。
1700237511
1700237512
你可能有点儿混乱了,难道不是物种越高等,基因组就越大么?当然不是,正如不能说鲸鱼、大象比人体型大,它们就比人类更高等一样。物种的基因组大小和它的复杂性之间没有严格的对应关系,这个现象被称为“C值悖论”。
1700237513
1700237514
C值悖论
1700237515
1700237516
我们终于可以正经地讲讲基因组了。基因组是生命的源代码,是细胞内所有的遗传信息的总和,是指导物种生长、发育和繁衍的基本程序。
1700237517
1700237518
30多亿年前,生命的第一个完整基因组诞生,它具有了复制、变异和遗传的特性,从诞生之日起便在这个星球上以不可阻挡的力量扩散和传承,形成了今天众多已知和未知的丰富多彩的生命形式。这些栖息于不同生命载体的基因组在时间和空间中有着无穷的多样性,基因组大小的变异就是其中之一。这个大小,我们用C值表示。
1700237519
1700237520
C值,即每一种生物的单倍体基因组DNA总量,或者通俗一点理解,也就是这个物种的所有扑克牌,即所有碱基对加在一起有多重。我们一般用皮克(pg,10~12克)表示,1pg的重量约等于1Gb(10亿个)的碱基对。虽然生命大致还是遵循了从简单到复杂、从低等到高等的演化模式,但正如刚才列举的例子,基因组大的物种并不一定更高等。
1700237521
1700237522
目前研究结果显示,对于每个生命大分支(细菌、真菌、动物、植物、藻类和原虫等),基因组大小与生命复杂度之间并没有绝对的相关性,“低等”生命可能拥有极大基因组,而“高等”生命的基因组可能小巧而精致,这就是物种之间基因组大小变异的C值悖论。
1700237523
1700237524
这似乎与我们的感性认识不相符合。
1700237525
1700237526
1700237527
1700237528
1700237529
示意图:陆生植物的基因组大小分布
1700237530
1700237531
(内圈是以苔藓植物为起点构建的陆生植物系统发育树,最小分支单元为科,各科按演化出现的时间先后顺序在图中逆时针排布;外圈有色条柱,高度代表该科平均基因组大小,单位Gb;内圈加粗的灰色分支对应的外圈基因组大小数值暂缺。数据引自:Jaume Pellicer, et al., Genome Size Diversity and Its Impact on the Evolution of Land Plants)
1700237532
1700237533
表面上看,我们会认为基因组越大的物种,越可能拥有更复杂、更高等的生命形式。然而,这就如同单看国土面积并不能和GDP(国内生产总值)成正比一样,GDP与该国的科技水平、人口组成、经济构成甚至宗教文化都有关系,谁也不知道国土面积数字背后是否为不宜居住和种植的沙漠或极寒地带。
1700237534
1700237535
另外,C值悖论与达尔文的演化论和自然选择理论也是不吻合的。人类基因组大小约是水稻基因组大小的七倍,却只有小麦基因组的约五分之一,在自然界的生命体中处于一个中间值位置,但人类却拥有无可比拟的语言沟通、劳动创造及建立社区和国家的能力。这就常常引起人们的思考:如果不是因为拥有超大或超复杂的基因组,又是什么让人类不同于其他生命脱颖而出,进而站在生命金字塔的顶端而主宰地球的?这是一个人类相关领域学家都关心的有趣问题。
1700237536
1700237537
而物种内部不同亚种之间,基因组大小各个层面的变异,却往往与很多重要表型性状相关联。而这些变异绝大多数来源于功能未知的异质染色质和非编码区域,也就是我们刚才提到的基因组中“暗物质”的部分。
1700237538
1700237539
最大的基因组有多大?
1700237540
1700237541
到目前为止,已发现的最小生命基因组(不包括病毒)只有0.0005pg(0.5Mb),来自布氏菌属;已报道的最小真核生命基因组来自寄生在一些哺乳动物的微孢子虫,约为2.25Mb;而最大的基因组来自植物界的日本重楼,也叫衣笠草,约为148.8Gb(前纪录保持者石花肺鱼的基因组大小约为132.8Gb),最大的真核基因组与最小的真核基因组之间的差距约为64000倍。这些记录基本达到了一个能行使正常生存繁殖功能的生命极限。
1700237542
1700237543
过去几十年,合成生物学致力于能够合成最小的功能基因组,这一直以来是人类试图证明“上帝扮演者”身份的重要尝试。同时,在基因组测序和组装领域,挑战解码最大的基因组序列也是人们孜孜不倦地解读大自然生命杰作的重要关注点。在这里,我们更多地探讨一下“巨型基因组”的问题,且主要关注基因组大小多样性最丰富的植物类群。
1700237544
1700237545
事实上,巨型基因组并不多见,大多数真核基因组都比较小(真核生物多样性极高,动植物仅仅是真核生命中极小的两个分支)。纵观所有真核生物,确有超过十多个物种基因组大小超过了100Gb(约占已知基因组大小物种的0.09%),来源于5个真核门类:一个来源于蕨类(Psilotales ),两个来源于开花植物(Liliales 和Santalales ), 两个来源于脊椎动物(Lepidosireniformes/lungfish 和Urodela/salamanders )。受当前检测技术限制,目前关于这些巨型基因组的结构和功能远未深入研究。
1700237546
1700237547
1700237548
1700237549
1700237550
巨型基因五大门类(横轴为各门类中基因大小的数值范围;横向排布的轴线宽度代表各门类物种基因组不同数值大小出现的相对频率。数据引自Hidalgo et al., Is There an Upper Limitto Genome Size?)
1700237551
1700237552
以迄今为止报道的最大的基因组日本重楼为例,其基因组大小接近150Gb,约为人类基因组的50倍。而实际上,日本重楼是个异源杂合的8倍体,这也暗示其细胞核中包含了将近1200Gb(150Gb×8)的碱基大小。一个碱基的长度约为0.34纳米,人类基因组单倍体的所有碱基连在一起约为1米(整个二倍体细胞的碱基连接起来是2米),而日本重楼单倍体的所有碱基连在一起长达50米,单个细胞核所有DNA碱基连在一起长达400米。很难想象这么巨量的遗传物质如何有效地组装在一个只有几微米级别的细胞核里。日本重楼生长速度极慢,这与其巨量遗传物质在每次DNA复制和细胞分裂中完成一次周期需要消耗的能量之大有关系。与此同时,这也引发我们进行相应的思考:150Gb的基因组大小是否是生命能承受的极限?单条染色体大小的极限会是多少?
1700237553
1700237554
生命承重的机制是什么?
1700237555
1700237556
究竟是什么样的生命机制和动力造就如此之大的巨型基因组?其中一个不容忽视的事实是,我们发现“重复”在生命的演化过程中是极其普遍和频繁的。毫不夸张地说,整个生命,甚至整个宇宙,都是由基本的信息单位或物质单位由不同形式的重复和排列形成的。
1700237557
1700237558
对于基因组来说,单碱基的串联复制,外显子的复制,基因的复制,大片段的复制,整条染色体的复制,甚至全基因组的复制,都是可以发生的。还用扑克牌类比的话,那就是从一张牌到一摞牌甚至一整副牌,都是可以根据需要(选择压力)不断复制的。在复制中变异,在复制中试错,在复制中创造,复制为整个生命演化提供了至关重要的力量。这个过程中,全基因组复制事件(一整副牌的复制)是基因组演化中最大的变异,其深刻地影响着物种基因组的结构、功能和适应性,影响着每一个基因、基因家族、遗传代谢通路和性状。
[
上一页 ]
[ :1.700237509e+09 ]
[
下一页 ]