1700171130
1700171131
然而例外似乎总是比规则更具说服力。例如,果蝇中有两个基因对其身体背部、腹部的形成过程至关重要。其中一个叫作生物皮肤生长因子(decapentaplegic),是决定背部发育的基因,表达该基因的细胞会发育成背部结构。另外一个叫作短原肠胚形成基因(short gastrulation),决定腹部发育,表达该基因的细胞会发育成腹部结构。蟾蜍、小鼠以及我们每一个人,也都存在两个非常相似的基因。其中一个是BMP4,其序列与生物皮肤生长因子相似;另一个是脊索蛋白(chordin),其序列与短原肠胚形成基因相似。但是令人惊讶的是,这些基因在小鼠和果蝇身上产生的是相反的效果:BMP4决定小鼠腹部结构,脊索蛋白决定背部结构。这意味着,节肢动物和脊椎动物的腹、背是相反的。在远古时代,节肢动物和脊椎动物可能有过共同的祖先,但是随着演化,其中一种后代选择了俯卧行走,另一种选择了仰卧行走。我们可能永远无法获知究竟哪一面朝上才是正确的,但是我们知道确实有一面是正确的,因为在节肢动物和脊椎动物分化之前,就已经出现了腹部基因和背部基因。在此,我们需要稍作停顿,先向一位伟大的法国人,艾蒂安·若夫华·圣希莱尔(Etienne Geoffroy St Hilaire)致敬。他在不同物种中观察了胚胎发育的方式,发现昆虫中枢神经系统位于它的腹部,而人类的位于背部。据此,他在1822年第一次提出了上述猜想。在之后的175年间,他的这个大胆猜想受到了很多讥讽。因为传统理论都是支持另外一个假说,即这两种动物的神经系统是独立演化的。但他的猜想完全正确。[5]
1700171132
1700171133
事实上,基因之间的相似性如此之大,以至于遗传学家现在几乎可以很常规地进行一些令人不可思议的实验:故意诱导果蝇中的某个基因发生突变,从而使其失活,然后用基因工程的方法将其替换成人类中的等效基因,最终培育出正常的果蝇。这种技术被称为“遗传拯救(genetic rescue)”。既然人类的同源异形基因可以拯救果蝇中的等效基因,小鼠中的Otx和Emx这两个基因应该也是可以的。事实上,被替换后的果蝇发育正常,以至于不太能分辨哪些是经人类基因替换过的果蝇。[6]
1700171134
1700171135
这证明本书最开始提到的数字假说是成立的。基因就像一系列软件模块,可以在任何计算机系统上运行:因为它们使用相同的代码,做着同样的工作。即使分离了5.3亿年,人类的“计算机”仍然能够识别果蝇的“软件”,反之亦然。所以计算机是一个非常贴切的类比。5.4亿到5.2亿年前的寒武纪大爆发时期,是生物体自由实验的时期,出现了各种躯体形态,这与20世纪80年代计算机软件设计的大爆发有些相似。可能就是这个时期,有一个物种很幸运地发明了首个同源异形基因,而我们又都从这个物种演化而来。几乎可以肯定的是,这个物种就是一种生活在泥土里的圆扁虫(Roundish Flat Worm,或RFW)。它只是生物体众多形态中的一个,但它却是地球上大多数生物的祖先。它是形态结构最好的那个吗?或者只是最流行的?谁是寒武纪大爆发中的“苹果”,而谁又是“微软”呢?
1700171136
1700171137
让我们从人类12号染色体的同源异形基因中挑选一个仔细地进行分析。同源异形基因C4在果蝇中对应的是dfd基因,dfd基因在果蝇成虫的口器中表达。C4基因的序列与其他染色体上的同源基因A4、B4和D4的序列非常相似。在小鼠体内也能找到与之对应的基因a4、b4、c4和d4。在小鼠胚胎中,这些基因在小鼠颈部表达:颈椎以及当中的脊髓。如果通过突变“敲除”其中1个基因,你会发现老鼠颈部的1到2块椎骨受到了影响。敲除后的影响是非常明确的,它使受影响的椎骨在小鼠颈部的位置比正常位置更为靠前。这4个同源异形基因的存在使每一节颈椎骨都与第一节不同。如果敲除其中2个基因,更多的椎骨会受到影响,如果敲除3个,受影响的颈椎骨会进一步增多。因此,这4个基因似乎有一种累积效应。这些基因按照从头到尾的顺序依次被激活,每个新基因被激活后就会将其负责发育的部分安装到前面已经组装好的身体后部。人类和小鼠的每个同源异形基因都有4份,果蝇只有1份,所以人类和小鼠对身体发育的控制要比果蝇更为精细。
1700171138
1700171139
现在也就清楚了为什么在每个同源异形基因簇中人类有多达13个同源异形基因,而果蝇只有8个。因为脊椎动物肛门后面有尾巴,也就是脊柱会经过肛门继续延伸,而昆虫则没有。小鼠和人类中比果蝇额外多出的同源异形基因,是负责后腰和尾巴发育的。由于我们的祖先在演化成类人猿后尾巴就消失了,所以小鼠中负责尾巴发育的基因在我们体内可能就没有表达了。
1700171140
1700171141
我们现在面临一个关键问题:在目前为止所研究的每个物种中,为什么同源异形基因都是首尾相连的,而且第一个基因总是在头部表达?目前还没有确切的答案,但有一条线索十分有趣,即排列在最前面的基因不仅在空间位置上表达在身体最前面的部位,在时间顺序上也是第一个表达。所有的动物都是从头到尾逐步发育的。因此,同源异形基因遵循时间顺序进行线性表达,很可能是每个同源异形基因激活后,会以某种方式去开启序列中的下一个,或者允许下一个基因被打开和读取。而且,动物的演化历程可能也遵循这样的过程。我们的祖先似乎是通过延长和发展尾部(而不是头部)来生长出更复杂的身体的。所以同源异形基因其实重演了物种演化过程。这正是恩斯特·海克尔(Ernst Haeckel)提出的“胚胎发育重演论”(ontogeny recapitulates phylogeny)。胚胎发育的顺序和生物演化的过程是相符合的。[7]
1700171142
1700171143
尽管这些故事很精彩,但它们只道出了故事的一些皮毛。上文讲述的是胚胎的发育模式,即上下不对称和首尾不对称。也讲述了有一组基因熟练地按照时间顺序依次启动,而且每一个都在身体的不同部位表达。每个同源异形区段都能够启动特定的同源异形基因,该基因又会反过来激活其他基因。不同区段之间必须以合适的方式进行功能的区分,比如这个区段要发育成肢体。接下来发生的最神奇之处是:相同的信号在身体的不同部位表达不同的意思。每个区段都知道自己的位置和身份,并据此对信号做出相应的反应。之前提到的生物皮肤生长因子就是一个信号触发器,它在果蝇身体的一个区段里促使腿部发育,在另一个区段里促使翅膀发育。生物皮肤生长因子又是由一个名为刺猬因子(hedgehog)的基因所触发的,而刺猬因子的功能是干扰那些使生物皮肤生长因子沉默的蛋白,以唤醒生物皮肤生长因子。刺猬因子是一种所谓的体节极性基因,它在每个体节都会表达,但是只表达在每个体节的后半部分。所以,如果把表达刺猬因子的组织移到果蝇翅膀的前半部分,你会得到一只有镜像翅膀的果蝇,两个前半部分在中间位置背靠背融合,两个后半部分在外面展开。
1700171144
1700171145
人类和鸟类也有类似刺猬因子的基因,这一点不足为奇。有三个非常相似的基因,分别称为音猬因子(sonic hedgehog)、印度刺猬因子(Indian hedgehog)和沙漠刺猬因子(desert hedgehog),它们在小鸡和人体内起着类似的作用。在前面的章节中,我曾经说过,遗传学家总是有一些奇怪的想法:现在又有一个被称为提吉温克(tiggywinkle)的基因,还有两个分别被叫作疣猪(warthog)和土拨鼠(groundhog)的基因家族。此处之所以这样命名,都是因为如果果蝇体内的刺猬因子出了差池,它的外表就会有种支棱棱的感觉,像刺猬一样。正如果蝇体内的刺猬因子那样,音猬因子与其他同伴基因一起负责确定肢体后半部分的位置。胚胎肢芽刚形成的时候,音猬因子就会启动,告诉肢芽哪个方向是后。如果在合适的时间,你将一个微珠浸入音猬因子蛋白,然后仔细插入鸡胚翅芽的拇指侧,24小时后,几乎可以得到与果蝇一模一样的结果:长出两个镜像翅膀,两个前半部分在中间背靠背融合,两个后半部分在外面展开。
1700171146
1700171147
换句话说,在果蝇和小鸡中,刺猬因子决定了翅膀的前后位置,然后同源异形基因继续分化为手指和脚趾。我们每个人都会经历从一个简单的肢芽发育成有五个手指的手的过程。很久以前,这种转变也曾发生过:4亿年前,第一批四足动物从鱼鳍中演化出手。最近科学界的重大发现之一就是,研究远古变迁的古生物学家与研究同源异形基因的胚胎学家一起发现彼此有一些共同之处。
1700171148
1700171149
故事始于1988年在格陵兰岛(Greenland)发现的一种名为棘螈(Acanthostega)的化石。棘螈是一种半鱼半四足的动物,生活在3.6亿年前。令所有人都惊讶的是它拥有典型的四足动物的四肢,肢体的末端都有八趾,这是早期四足动物在浅水中爬行时尝试的几种体型之一。渐渐地,从其他化石中,我们发现人类的手其实是以一种奇怪的方式从鱼鳍演化而来的:通过手腕处长出一块向前弯曲的弓形骨骼,然后手指沿着这个方向继续向后(小拇指的方向)延伸。现在我们仍然可以通过自己手部的X光片看到这个模式。所有这些都是从对化石的研究中得出来的。所以想象一下,当古生物学家看到胚胎学家在同源异形基因方面的发现与其如出一辙时,会有多么惊讶。首先,同源异形基因于正在生长的肢体前端设置一个梯度表达曲线,将其分成独立的手臂和手腕。然后在最后一块骨头的外侧设置了一个与手臂相反方向的梯度,以生长出五根手指。[8]
1700171150
1700171151
同源异形基因和刺猬因子绝非控制发育的唯一基因。许多其他基因,在指示身体各个部位生长的位置和方式以及如何出色地完成自我组装方面,发挥着巧妙的作用,比如:“配对框基因(pax genes)”和“裂隙基因(gap genes)”,以及一些名为激进边缘(radical fringe)、跳过偶数(even-skipped)、短节(fushi tarazu)、驼背(hunchback)、瘸子(Kruppel)、巨人(giant)、波纹(engrailed)、夹子(knirps)、奶油包(windbeutel)、仙人掌(cactus)、凶鸟(huckebein)、大蛇(serpent)、黄瓜(gurken)、奥斯卡(oskar)和无尾(tailless)。学习胚胎遗传学这门新知识,有时感觉就像进入了托尔金(Tolkien)的小说里:需要你学习大量的词汇,但是不需要学习一种新的思维方式,这正是它的奇妙之处。胚胎遗传学没有复杂的物理现象,没有混沌理论或量子力学,没有新奇的概念。就像遗传密码的发现一样,起初以为要用全新的理论来解释,最后发现其实异常简单易懂。从受精卵形成不对称的化学物质开始,后续的一切都是按照流程来。基因彼此激活,使胚胎分出头部和尾部。然后,其他基因按照从头到尾的顺序依次启动,从而赋予每个区段一个身份。另有其他基因进一步决定这些区段的前后方向。最后还有基因理解上述所有信息,进一步生成更复杂的附件和器官。这是一个相当基础的、化学机械的、循序渐进的过程,它对亚里士多德的吸引力会比苏格拉底多。胚胎发育原则上就是如此简单(尽管细节并非如此):从一个简单的不对称发展成复杂的模式,以至于人们不禁会想,人类工程师或许应该复制它并据此发明出可以自我组装的机器。
1700171152
1700171153
1700171154
1700171155
1700171157
基因组:生命之书23章 13号染色体 史前
1700171158
1700171159
那遥远的过去依旧年轻。
1700171160
1700171161
——弗朗西斯·培根
1700171162
1700171163
蠕虫、苍蝇、小鸡和人类在胚胎基因上有着惊人的相似,有力地证明了它们拥有共同的祖先。我们之所以知道这种相似性,是因为DNA是一种用简单字母(一种语言)所编写的代码。通过比较发育基因中的词汇,发现它们有着相同的用词。尽管层次不同,通过类比也不难发现,基因语言和人类语言其实是相通的:通过对比人类的措辞用语,就可以推断出他们的共同祖先。例如,意大利语、法语、西班牙语和罗马尼亚语都有来自拉丁语的词根。语言学和遗传系统发育这两个过程在人类迁徙历史这一主题上产生了交集。历史学家或许会为缺乏远古史前历史的书面记载而感到遗憾。如果说基因是一种书面记录,人类语言便是一种口头记录。13号染色体很适合用来讨论遗传系谱,其原因嘛,自会慢慢道来。
1700171164
1700171165
1786年,加尔各答的英国法官威廉·琼斯(William Jones)爵士在皇家亚洲学会的一次会议上宣布,他对古印度梵语的研究表明,梵语跟拉丁语和希腊语是一脉相承的。作为一个博学的人,他还认为自己发现了这三种语言与凯尔特语、哥特式和波斯语之间的相似之处。他认为这些语言都“有着相同的来源”。他的推理方式与导致现代遗传学家提出5.3亿年前存在圆扁虫的推理方式大同小异:词汇的相似性。例如,“three”这个单词在拉丁语中是“tres”,在希腊语中是“treis”,在梵语中是“tryas”。当然,口语和基因语言之间的巨大区别在于口语里借用了很多外来词汇。也许梵语里“tryas”这个单词就是借用了西方语言。后来的研究证实,琼斯是完全正确的。曾经有过这么一伙人,他们生活在某个地方,操着同一种语言,他们的后代将此语言带到了遥远的爱尔兰和印度,并逐渐演变成现代语言。
1700171166
1700171167
我们甚至可以知晓这些人的些许信息。众所周知,印欧人至少在8000年前就已从本土向外扩张。至于他们的家乡,有人认为是在如今的乌克兰,但更可能是位于现在土耳其的丘陵地带(因为当地语言中有山丘和湍流等字眼)。无论哪种说法正确,他们无疑都是农民——他们的语言里也有庄稼、牛、羊和狗等词句,由此可以推测他们生活于农业刚在叙利亚和美索不达米亚新月沃土兴起之时。我们很容易便会想到,其母语得以成功传播到两大洲,无疑得归功于他们的农业技术。但是他们是否以同样的方式扩散基因呢?我要用迂回的方式来说说这个问题。
1700171168
1700171169
如今,在印欧人的家乡安那托利亚,人们说土耳其语。它不属印欧语系,而是之后由马背游牧民族和武士们从中亚大草原和沙漠中带过来的。这些“阿尔泰”人的语言里充斥着有关马的各种俗语,这表明他们有着高超的马术技巧。第三大语系是乌拉尔语,分布在俄罗斯北部、芬兰、爱沙尼亚以及(竟然在)匈牙利,见证了先前另一民族在印欧人之后使用未知技术(也许是放牧家畜)得以实现成功扩张的过程。现今,俄罗斯北部的撒摩耶驯鹿牧民或许是典型的乌拉尔语使用者。但是,如果你深入研究,会发现印欧、阿尔泰和乌拉尔这三大语系之间必定有着深厚渊源。它们均源自大约1.5万年前在整个欧亚大陆被猎采者们所广泛使用的某种语言,通过其后代语言中的共同用词可以判断出,那时除了狼(狗)以外,还未驯化出任何动物。诺斯特拉语系的分支该如何进行划分,尚存在分歧。俄罗斯语言学家弗拉迪斯拉夫·伊利奇·斯维特奇(Vladislav Illich-Svitych)和阿哈隆·多尔戈波尔斯基(Aharon Dolgopolsky)倾向于将在阿拉伯和北非所使用的亚非语系包括在内,而斯坦福大学的约瑟夫·格林伯格(Joseph Greenberg)却没有将这些语系包括在内,他认为应加进的,是东北亚的堪察加语和楚科奇语。伊利奇·斯维特奇在推演出词根的发音之后,甚至用其音标写了一首小诗。
1700171170
1700171171
从那些简单且变化极小的词中不难窥见诺斯特拉语系成员众多的铁证。例如,印欧语、乌拉尔语、蒙古语、楚科奇语和因纽特语几乎都在用或都曾使用“m”来代表“me”,以及用“t”来代表“you”(如法语“tu”)。一连串这样的例子令巧合假说不攻自破。很明显,葡萄牙语和韩语几乎可以肯定是来自同一种语言。
1700171172
1700171173
我们可能永远解不开诺斯特拉人的秘密。也许他们是首创用狗或上弦的武器进行狩猎的人,也许有过一些不那么有形的东西,比如民主决策,但是他们并没有彻底消灭先辈们留下的痕迹。有充分的证据表明,巴斯克语、几种在高加索山脉使用的语言,以及现已消失的伊特鲁里亚语,并不属于诺斯特拉这个超语系,而是与同属纳-德内这个超语系的纳瓦霍语以及一些汉语有着密切关联。我们在此讨论的多半只是猜测,不过,在比利牛斯山脉(山脉会阻碍人类迁徙,大部人马因此需要绕道而行)中残存着巴斯克语,通过语言中所涉地名可知它曾分布广泛,且与克罗马农猎人留下的石洞壁画内容恰好吻合。巴斯克语和纳瓦霍语是最早的现代人类语言化石吗?是这些人赶走了尼安德特人并扩展到了欧亚大陆吗?说这些语言的人真的是中石器时代人的后裔吗?他们周遭满是讲印欧语的新石器时代人的后裔吗?或许不是,但其可能性不容小觑。
1700171174
1700171175
在20世纪80年代,著名的意大利遗传学家路易吉·路卡·卡瓦利-斯福扎(Luigi Luca Cavalli-Sforza)注意到了语言学的这些最新发现,之后明确地提出了一个问题:语言与遗传的边界相一致吗?由于通婚(大多数人只讲一种语言,但享有祖父母、外祖父母共四个人的基因),遗传边界不可避免地变得更加模糊了。法国人和德国人之间的基因差异远小于法语和德语之间的差异。
1700171176
1700171177
尽管如此,还是有一些规律可循。通过收集简单基因的常见已知变异(即经典多态性)数据,并对结果数据进行巧妙的统计(即主成分分析),卡瓦利-斯福扎绘制了五幅不同的欧洲基因频率等高线图。第一幅图显示等高线是从东南到西北逐渐倾斜,这或许反映了新石器时代农民最初是从中东流向欧洲的,这几乎准确地呼应了大约9500年前农业传播到欧洲的考古数据。这幅图解释了其样本中28%的遗传变异。第二幅等高线图为东北走向,呈陡坡状,反映了乌拉尔语使用者的基因,这幅图解释了22%的遗传变异。第三幅图解释了11%的遗传变异,基因频率以乌克兰草原为中心,向四周散射,反映了大约公元前3000年草原游牧民族从草原向伏尔加-顿河运河区域的扩张。第四幅图中遗传变异占比依然较低,它的最高点在希腊、意大利南部和土耳其西部,很可能反映了公元前一两千年希腊人的扩张。最有趣的当属第五幅图,图中基因频率非同寻常,呈小而陡峭的尖峰状,与西班牙北部和法国南部的大(原)巴斯克国几近完全重合。因此,巴斯克人是欧洲前新石器时代人中的幸存者,这种看法似乎是站得住脚的。[1]
1700171178
1700171179
换句话说,基因支持语言学方面的证据,即具有新技能的人的扩展和迁移在人类演化中发挥了重要作用。基因地图比语言地图更为模糊,但也更为微妙。同样,小范围来看,还可以挑选出与语言区域相一致的特征。例如,在卡瓦利-斯福扎的故乡意大利,就有一些遗传区域与古老的伊特鲁里亚人、热那亚地区的利古里亚人(讲一种非印欧语系的古代语言)以及意大利南部希腊人的语言区域相一致。显而易见,语言和民族在某种程度上是融为一体的。
[
上一页 ]
[ :1.70017113e+09 ]
[
下一页 ]