打字猴:1.700237527e+09
1700237527
1700237528
1700237529 示意图:陆生植物的基因组大小分布
1700237530
1700237531 (内圈是以苔藓植物为起点构建的陆生植物系统发育树,最小分支单元为科,各科按演化出现的时间先后顺序在图中逆时针排布;外圈有色条柱,高度代表该科平均基因组大小,单位Gb;内圈加粗的灰色分支对应的外圈基因组大小数值暂缺。数据引自:Jaume Pellicer, et al., Genome Size Diversity and Its Impact on the Evolution of Land Plants)
1700237532
1700237533 表面上看,我们会认为基因组越大的物种,越可能拥有更复杂、更高等的生命形式。然而,这就如同单看国土面积并不能和GDP(国内生产总值)成正比一样,GDP与该国的科技水平、人口组成、经济构成甚至宗教文化都有关系,谁也不知道国土面积数字背后是否为不宜居住和种植的沙漠或极寒地带。
1700237534
1700237535 另外,C值悖论与达尔文的演化论和自然选择理论也是不吻合的。人类基因组大小约是水稻基因组大小的七倍,却只有小麦基因组的约五分之一,在自然界的生命体中处于一个中间值位置,但人类却拥有无可比拟的语言沟通、劳动创造及建立社区和国家的能力。这就常常引起人们的思考:如果不是因为拥有超大或超复杂的基因组,又是什么让人类不同于其他生命脱颖而出,进而站在生命金字塔的顶端而主宰地球的?这是一个人类相关领域学家都关心的有趣问题。
1700237536
1700237537 而物种内部不同亚种之间,基因组大小各个层面的变异,却往往与很多重要表型性状相关联。而这些变异绝大多数来源于功能未知的异质染色质和非编码区域,也就是我们刚才提到的基因组中“暗物质”的部分。
1700237538
1700237539 最大的基因组有多大?
1700237540
1700237541 到目前为止,已发现的最小生命基因组(不包括病毒)只有0.0005pg(0.5Mb),来自布氏菌属;已报道的最小真核生命基因组来自寄生在一些哺乳动物的微孢子虫,约为2.25Mb;而最大的基因组来自植物界的日本重楼,也叫衣笠草,约为148.8Gb(前纪录保持者石花肺鱼的基因组大小约为132.8Gb),最大的真核基因组与最小的真核基因组之间的差距约为64000倍。这些记录基本达到了一个能行使正常生存繁殖功能的生命极限。
1700237542
1700237543 过去几十年,合成生物学致力于能够合成最小的功能基因组,这一直以来是人类试图证明“上帝扮演者”身份的重要尝试。同时,在基因组测序和组装领域,挑战解码最大的基因组序列也是人们孜孜不倦地解读大自然生命杰作的重要关注点。在这里,我们更多地探讨一下“巨型基因组”的问题,且主要关注基因组大小多样性最丰富的植物类群。
1700237544
1700237545 事实上,巨型基因组并不多见,大多数真核基因组都比较小(真核生物多样性极高,动植物仅仅是真核生命中极小的两个分支)。纵观所有真核生物,确有超过十多个物种基因组大小超过了100Gb(约占已知基因组大小物种的0.09%),来源于5个真核门类:一个来源于蕨类(Psilotales ),两个来源于开花植物(Liliales 和Santalales ), 两个来源于脊椎动物(Lepidosireniformes/lungfish 和Urodela/salamanders )。受当前检测技术限制,目前关于这些巨型基因组的结构和功能远未深入研究。
1700237546
1700237547
1700237548
1700237549
1700237550 巨型基因五大门类(横轴为各门类中基因大小的数值范围;横向排布的轴线宽度代表各门类物种基因组不同数值大小出现的相对频率。数据引自Hidalgo et al., Is There an Upper Limitto Genome Size?)
1700237551
1700237552 以迄今为止报道的最大的基因组日本重楼为例,其基因组大小接近150Gb,约为人类基因组的50倍。而实际上,日本重楼是个异源杂合的8倍体,这也暗示其细胞核中包含了将近1200Gb(150Gb×8)的碱基大小。一个碱基的长度约为0.34纳米,人类基因组单倍体的所有碱基连在一起约为1米(整个二倍体细胞的碱基连接起来是2米),而日本重楼单倍体的所有碱基连在一起长达50米,单个细胞核所有DNA碱基连在一起长达400米。很难想象这么巨量的遗传物质如何有效地组装在一个只有几微米级别的细胞核里。日本重楼生长速度极慢,这与其巨量遗传物质在每次DNA复制和细胞分裂中完成一次周期需要消耗的能量之大有关系。与此同时,这也引发我们进行相应的思考:150Gb的基因组大小是否是生命能承受的极限?单条染色体大小的极限会是多少?
1700237553
1700237554 生命承重的机制是什么?
1700237555
1700237556 究竟是什么样的生命机制和动力造就如此之大的巨型基因组?其中一个不容忽视的事实是,我们发现“重复”在生命的演化过程中是极其普遍和频繁的。毫不夸张地说,整个生命,甚至整个宇宙,都是由基本的信息单位或物质单位由不同形式的重复和排列形成的。
1700237557
1700237558 对于基因组来说,单碱基的串联复制,外显子的复制,基因的复制,大片段的复制,整条染色体的复制,甚至全基因组的复制,都是可以发生的。还用扑克牌类比的话,那就是从一张牌到一摞牌甚至一整副牌,都是可以根据需要(选择压力)不断复制的。在复制中变异,在复制中试错,在复制中创造,复制为整个生命演化提供了至关重要的力量。这个过程中,全基因组复制事件(一整副牌的复制)是基因组演化中最大的变异,其深刻地影响着物种基因组的结构、功能和适应性,影响着每一个基因、基因家族、遗传代谢通路和性状。
1700237559
1700237560 很多基因组在演化过程中都频繁经历全基因组复制事件。比如脊椎动物的祖先就曾经历过至少两次古老的全基因组复制事件,这两次事件对动物从无脊椎到脊椎的过渡起到了关键的作用,尤其是对其形态长成方面的塑造。而对于植物,90%以上的陆地植物均经历过一次或多次全基因组复制事件。另一方面,虽然现存的很多物种均以二倍形式存在,但也同时存在多倍体的物种形式,如六倍体小麦、四倍体土豆等;还有为了某种特定目的而人工培育的,如三倍体无子西瓜。
1700237561
1700237562 与此同时,还有一类很淘气的扑克牌,可以在一摞牌甚至整副牌中跳来跳去,我们称之为“跳跃的基因”,即转座子[1] ,这类活动对巨型基因组大小的塑造也功不可没。由于占据了基因组的大部分比例(如玉米基因组80%以上是转座子,此项发现于1983年获得诺贝尔奖),故转座子被视为“暗物质”中非常重要的一类,是研究基因组大小变异与功能的热门课题。
1700237563
1700237564 无尽的谜题
1700237565
1700237566 所有的真核生命的遗传物质均是以染色体为载体进行信息储存、复制和传递的。有趣的是,人们发现染色体数目多少与物种分化、新性状的产生没有必然联系,这与最近人们通过合成生物学方法将16条酵母染色体连成一条染色体但酵母细胞生命状态却相似的发现是相一致的。另一方面,相似的基因组大小,由于编排方式和重组规律不同,又会形成完全不同的生命存在形式。比如人类基因组约为3Gb,23对染色体,而拥有7对染色体的植物茴香,其基因组大小也在3Gb左右,但人类与植物茴香是两种完全不同的生命形式,其关键在于基因内容及其排列组合的不同。
1700237567
1700237568 在高等植物染色体数目中,12是一个出现频率最高的数字。在数学上,12同时是2、3、4、6的公约数;在生活中人类也较为偏爱12这个数字,一个生肖轮回12年,一年有12个月,星座有12个,时针转一圈是12个小时,一英尺等于12英寸,12个称为一打,甚至人有12对脑神经,等等。而在演化上,为什么很多物种最终选择12套染色体编排它们的遗传物质,同样是个有趣的问题。
1700237569
1700237570 科学研究还发现,很多大基因组拥有较少的染色体数目,而一些拥有成百上千条染色体的物种的基因组大小却并不大(意思是扑克牌多少和分几摞关系也不确定)。另一个较明显的现象是,一个细胞中的DNA遗传物质并不是平均分布于每条染色体上的,而是同一个物种不同染色体大小之间存在多样性(意思是一副牌总是分成不均匀的若干摞)。而在染色体复制和细胞分裂中起到重要作用的着丝粒也并不位于每条染色体的中间,而同样存在多样性,如长臂/短臂比例分布不均匀(也就是说每摞牌一分为二的时候,切牌的位置也是不均匀的)。对于形成这种多样性的机制,究竟是随机的还是有某种选择上的适应性,又或仅仅是演化过程中的一种暂时性安置或试错,都是值得寻味的问题。
1700237571
1700237572 [1] 一类可以移动的DNA序列,通过切割、重新整合等一系列过程,转座子可以从基因组一个位置转移到另一个位置。
1700237573
1700237574
1700237575
1700237576
[ 上一页 ]  [ :1.700237527e+09 ]  [ 下一页 ]