打字猴:1.7002545e+09
1700254500
1700254501 如果我们知道DNA的碱基序列,预测蛋白质链上的氨基酸序列应当是一件易如反掌的事。但事实上,蛋白质的结构不只是它的氨基酸序列那么简单,蛋白质盘绕成错综复杂的三维空间结构,要了解它们的功能,比如如何加速化学反应,我们必须知道蛋白质的结构和变化形式,然而至今我们都无法完全参透这个复杂的过程。从19世纪50年代开始,关于蛋白质如何折叠的研究就已经在血液的珠蛋白中展开,但是这些实验往往过程烦琐、耗时又长。通过DNA碱基序列预测氨基酸链不是什么难事,但是预测蛋白质的折叠方式就要复杂得多,就像要把爱尔兰诗人和剧作家叶芝的诗翻译成中文一样。
1700254502
1700254503 对于想要探索表现型来源的人们来说,这并不是什么好消息。想要了解生物体的表现型,不管是彩色的翅膀、敏锐的眼睛还是强健的骨骼,归根结底还是要了解组成生物体最基本的大分子结构。如果我们无法预测大分子的形态,就无法从基因型跨越到表现型。
1700254504
1700254505 不过每个蛋白质不都总是独立存在的,它们往往通过共同合作来应对机体复杂机制的作用,这让我们理解蛋白质的努力更是雪上加霜。以胰岛素为例,它是一种由胰腺分泌的,主要负责分解吸收葡萄糖的蛋白质分子,并能促进血糖进入肝脏。胰岛素无法直接进入肝脏,它是通过和肝脏细胞上的胰岛素受体相结合,受体会激活肝脏细胞内的另一些蛋白质,继而引发一系列连锁反应,促进葡萄糖分解的。我们的身体内每分每秒都在进行着类似的分子运动。自沃森和克里克发现双螺旋结构之后,分子生物学家开始前赴后继地研究这一类问题。通过对一条条蛋白质链的研究,他们逐渐揭开了复杂大分子网络的神秘面纱,如那些控制人体感官和行为的大分子,甚至是任何一个方面的分子结构。
1700254506
1700254507 人类在这条研究之路上已经耕耘了很久,也收获了很多。走得越远,才越发现这条道路的漫长和蛋白质网络的复杂,从基因型转向表现型的探索也越加深远。
1700254508
1700254509 然而综观整个20世纪,仍然有很多支持进化论的生物学家完全不为表现型的复杂性所动。他们沐浴在现代综合进化论的阳光下,沉浸在对基因型的研究当中,这种执着在沃森和克里克的发现席卷了无知的人类之后,由于DNA分子序列识别新技术的出现而变得更加疯狂。这些技术也带动了一个新兴领域的诞生,叫作“分子进化生物学”(molecule evolutionary biology),主要研究氨基酸和DNA序列的变异。这项技术的前身就跟迈布里奇的诡盘投影机一样笨拙低效,一年时间只能研究不到几百个碱基对。而到了19世纪80年代中期,分析的效率提高了将近10倍,足以对人群中多个较短的DNA序列进行检测。
1700254510
1700254511 分子进化论者在这项技术的帮助下,发现了一件始料未及的事情:数量众多的基因变异在基因组中无处不在,甚至在那些数亿年中都没有发生明显改变的生物体内亦是如此。
1700254512
1700254513 分子进化领域一个早期的研究对象是醇脱氢酶,一种人体用于代谢酒精的酶。人类体内携带有这个酶的基因,果蝇亦然。我们不知道果蝇会不会因为啃食腐烂的水果而嗨得像摇滚乐队的歌迷一样,但我们至少知道果蝇对这些腐烂的水果趋之若鹜的同时,肯定需要醇脱氢酶来防止酒精中毒。1983年,哈佛大学的马丁·克雷特曼(Martin Kreitman)在一小群果蝇身上发现了这个基因的43种不同变异体。类似的变异也存在于人体当中,其中一种还会导致酒精过敏。酒精过敏曾在亚洲人的祖先中普遍存在,当时人们称之为“亚洲红脸症”(asian flush)。
1700254514
1700254515 但是克雷特曼在针对醇脱氢酶的研究中忽略了一个更大的秘密:大多数的基因变异是不表达的,它们改变了DNA序列,却没有改变醇脱氢酶的氨基酸序列。鉴于三核苷酸的密码子体系中,不少密码子对应的氨基酸相同,所以这种情况是可能的。但即便密码子具有冗余性,也不足以解释所有突变在遗传上表现出来的稳定性,毕竟突变有时候会穿插在密码子的3个碱基之间,从而彻底打乱遗传序列。所以,在突变中肯定还发生了一些不为人知的事。
1700254516
1700254517 这件事,就是自然选择。对酶分子不利的变异与它们对应的突变基因一起,早就在克雷特曼发现它们之前就被自然选择淘汰了。
1700254518
1700254519 克雷特曼的发现,以及其他类似的研究结果都反映了同一个现象:进化论思想中的进步与其他科学领域的改革不同。20世纪早期的量子物理学带来了和传统的经典物理学相冲突的世界观,而进化生物学的改革却丝毫不影响先前理论的核心观点。它们进一步深化、改造了历史,而不是推翻它。这些理论添加了层层的解释和方法,带来了新的视角。
1700254520
1700254521 正如电影《奔腾年代》(Seabiscuit)给萨莉·加德纳那第一次被记录下来的片子加上了颜色、音乐、对话和马蹄声,但是不会推翻迈布里奇对奔马四脚离地这一神奇现象的阐述。达尔文发现了自然选择的力量,现代综合进化论从基因频率的角度解释了自然选择,而分子进化生物学家则试图在DNA中寻找自然选择的蛛丝马迹,例如大量存在的不表达基因。不同的分支学科通力合作,渐渐揭开了达尔文留给世人的层层迷团。之所以不是所有的迷团,是因为分子进化生物学告诉我们更多的是有关生物基因的东西,而不是表现型,后者才是生物起源的核心问题。
1700254522
1700254523 克雷特曼在醇脱氢酶中发现的变异并不是巧合,类似的变异在自然界中广泛存在,甚至在活化石腔棘鱼中也有。人们曾经以为这种鱼早已灭绝,直到1939年又发现了幸存的个体。未表达突变的普遍性至今还在困扰着分子进化学家们:它们于表现型变化而言重要吗?它们和生物进化又是否有着紧密的联系?我们只知道,未表达突变的存在让基因型与表现型的关系变得更加扑朔迷离,表现型背后的原理依旧让人捉摸不透。
1700254524
1700254525
1700254526
1700254527
1700254528 在20世纪80年代,光是掌握识别DNA碱基对的技术已经令人称奇。然而,与庞大的整个人类基因组相比,小小的碱基对就相形见绌了。人类基因组包含了30亿个碱基对,比《大英百科全书》还长10倍。我们身体内的每个细胞都拥有一套完整的基因组,高度压缩后形成了46条染色体。如大肠埃希氏菌这样微小的细菌都有450万对碱基对,比世界上最长的小说之一《战争与和平》的字数还多。高效测定单个个体的DNA序列所需要的技术还亟待改善,更不用说整个种群了。
1700254529
1700254530 发展这项技术的推动力来自“人类基因组计划”,这是于1990年启动的一个大型国际合作项目,由美国国家卫生研究院牵头。项目宗旨在于了解导致疾病的基因,遗传病相当于一种特殊的新表现型。1998年,克雷格·文特尔(Craig Venter)[5]创立了塞莱拉基因科技(Celera Genomics)公司,立刻成了上述组织的强大竞争对手。文特尔的公司设法用1/10的成本测定所有的基因,并在2000年与公立组织在同一时间宣布完成了第一幅完整的人类基因组草图的绘制。
1700254531
1700254532 人类基因组是生物学领域众多的里程碑之一,它展示了无数的基因信息:人类所有的基因以及它们所编码的蛋白质序列等。克林顿总统在2000年的国情咨文中把人类基因组草图称为“生命的蓝图”。可惜的是,即使真如克林顿所言,那它也不过是一张陈旧的蓝图,我们无法从中搭建出它所描绘的宏伟景象,甚至都不知道该让建筑工人到哪里去施工。因为迄今为止,“人类基因组计划”依旧没有透露给我们任何与表现型相关的有用信息。许多人希望“人类基因组计划”能对关于一个人是否会得某种遗传疾病给出一个肯定的答案,而以下是克雷格·文特尔在2010年德国《明镜周刊》的专栏采访中关于预测基因疾病的陈述:
1700254533
1700254534 我们从基因组当中只能得出遗传疾病发生的可能性而已。在临床医学中,如果告诉你罹患某种遗传病的可能性是1%或3%又有什么意义呢?这些信息一文不值。
1700254535
1700254536
1700254537
1700254538 这个评价虽然苍凉,却是不争的事实。其中的理由或许你已经猜到了:基因型和表现型的关系复杂得难以想象。雄心勃勃犹如“人类基因组计划”,也只不过是从基因型出发,前往表现型途中的又一个一公里而已,这条路的尽头依旧遥不可及。
1700254539
1700254540 虽然“人类基因组计划”有它的局限性,但也带来了许多益处,其中一个就是DNA测序技术的蓬勃发展。2000年,一个操作者能在24小时内读取完100万个碱基对;到了2008年,测序仪器已经能够在相同的时间内测定10亿个碱基对。这项技术还在迅猛发展着。在你阅读这两行字的时间段里,基因组测序的成本就可能已经从1 000美元降到几美分了。这些技术使得研究人类和其他物种的基因变异成为可能,它们把种群基因学上升到了种群基因组学的高度。
1700254541
1700254542 种群基因组学的诞生意味着基因型研究的终点,但对表现型来说却并非如此。在20世纪50年代中期,有关蛋白质的功能以及相互作用的研究就已经启动,科学家们一路高歌猛进,势如破竹。但时至20世纪90年代,他们就不得不转换研究思路了。以胰岛素为例,先前的研究已经让我们明确了合成胰岛素所需的基因,以及这些基因所编码的蛋白质和功能。但这些信息无外乎“谁是谁”或者“谁知道谁”,它们只是对信息进行了明确和组合,而对于预测个体的表现型,例如一个人是不是会得糖尿病,则丝毫没有用处。
1700254543
1700254544 科学家努力得到的结果还不足以告诉我们关键的细节,例如一个过程中涉及的蛋白质分子数量为多少,或者分子之间的关系强弱为几何。糖尿病的病因涉及几十种蛋白质大分子,每一种对糖尿病的患病都只有几个百分比的助益,它们之间通过相互作用对诱发糖尿病产生微妙的影响。所以单纯系统地罗列所有相关的蛋白质分子以及它们各自的特性,对于我们理解生命过程而言收效甚微。我们需要弄清楚不同分子之间是如何相互协作的。
1700254545
1700254546 处理这种整体性的唯一手段是数学,数学能够消化大量的实验数据,从而描述生物大分子的活动和密度是如何随时间变化的,这些活动是理解表现型的关键。举个例子,Ⅱ型糖尿病发病时身体会发生胰岛素抵抗,这是一种与健康人完全不同的表现型:胰腺释放胰岛素,但由于肝脏对胰岛素不敏感,所以从胰岛素受体开始,激素信号会在传递的某个环节突然减弱或增强。这个改变影响了信号链,因而诱发了疾病。只有数学的精确量化能够帮助我们理解这种微妙的过程,这是单纯的罗列和分类做不到的。
1700254547
1700254548 然而,用数学方法描述表现型并非易事,从数十年的实验数据来看,主要大分子相互之间的相互作用有许多变量。这些计算的复杂性绝非简单的人工笔算所能完成,即使是最杰出的数学家也做不到,必须要有计算机的协助。
1700254549
[ 上一页 ]  [ :1.7002545e+09 ]  [ 下一页 ]