1700229470
基因:不平等的遗传 第三章 既然遗传力这么高,为什么我们找不到?
1700229471
1700229472
当20世纪80 ~ 90年代、分子遗传学的时代正式拉开帷幕时,有志于人类行为学研究的生物学家纷纷感到欢欣鼓舞:他们终于能够破解基因组的黑匣子,直接测量基因的影响。之前他们为了研究做出的那些关于双生子、领养儿童等的假设,常常遭到他人的误解和嘲笑。现在他们再也不需要依赖这些假设了,可以直接研究基因对于社会现象的影响。科学家可以深入探究其生物学机理,并且更详细地了解从细胞到社会的各种影响路径。他们甚至能够有针对性地研发焦虑症、抑郁症、精神分裂症,甚至是认知障碍症的基因疗法。在这些疾病中,有50%~75%的差异是由基因造成的,彻底了解哪些基因在起作用是真正走向“临床议程”社会生活的第一步。但事实证明,与估计遗传力一样,对人类行为的分子基础研究(以及对大部分表型的研究)同样困难重重。
1700229473
1700229474
回想过去,科学家曾认为他们将发现决定性别、智商等性状的基因,这种想法现在看来确实很幼稚。与瞳色这种由3个基因就能决定的简单性状相比,社会生活的情况要复杂得多。即便是身高这种受遗传影响极大的性状都是多个基因调控的。换句话说,尽管其中每个基因的作用都很微小,但这类性状受到成百上千个基因的共同影响。假如说连身高这种性状都要由成百上千的基因才能决定,那么社会行为就必然是大多已知基因共同作用的结果了。
1700229475
1700229477
冲击一:候选基因研究
1700229478
1700229479
早在近25年来的基因组革命之前,就已经有人发现:如果特定位置上的基因按照某种方式产生变异(mutate),人体就会受到巨大影响。这样的遗传病被称为孟德尔病(Mendelian diseases),其中的亨廷顿病(Huntington’s)就是一个典型例子。这类疾病是由于基因发生可遗传的变异和错乱,从而导致一些基因无法发挥正常作用引发的。当单基因遗传病呈隐性(recessive)时(必须要同时具备两个致病基因才会导致发病),一些致病基因的携带者并不会表现出某些症状。但如果两个携带者婚配,他们生育的后代又不幸同时获得了双亲携带的致病基因,那么这个孩子就会患病。亨廷顿病与镰刀型贫血症(sicklecell anemia)都属于这种类型的遗传病。
1700229480
1700229481
即使是癌症,我们也可以认为它符合这种OGOD(One Gene,One Disease, 即一个基因对应一种疾病)原则。许多癌症的发生就是因为某个抑癌基因(tumor suppressor gene)发生了变异,导致其不能抑制细胞周期,进而导致细胞疯狂增殖。假如一个人的某对抑癌基因中只有一个能正常运行,另一个失效的话,那么,当这个正常基因发生变异(可能是因为致癌环境,也可能仅仅是偶然的复制错误)时,这个细胞的增殖就会失控。另一种情况是原癌基因(作用是促进细胞生长)发生变异,成为致癌基因,活性比之前提高(在抑癌基因的情况下,恶性变异会导致其活性降低),于是大大加快了细胞的生长和增殖。不过需要注意的是,这种情况还是略微有些夸张,因为单个基因的变异在大部分情况下都不足以引起癌变。我们的身体有其他手段来防止细胞增殖失控,不过有时候这些防卫手段也会遭到破坏。对于我们而言,关注的要点是探索特定基因对应的作用。这可以说是遗传学领域的惯例了。
1700229482
1700229483
在已知遗传病的背景下,较早的文献采用分子遗传学的方法来研究人类行为,致力于用单个基因控制性状的思路去解释问题。科研人员通常采用两种测定基因变异的方式。第一种方式是研究人类基因组特定位点的单核苷酸多态性(SNP,读作“snip”)。单核苷酸多态性就是指染色体上特定碱基对的变化,而且这种变化至少存在于1%的人口中。第二种方式则是关注CNV(基因拷贝数的变化),也就是在某一给定片段内核苷酸重复次数的变化。通过关注CNV,我们可能发现有些人有TTATTATTA这种重复三次的TTA片段,而其他人的TTA片段则可能重复四五次。发现新基因的进程比较缓慢,但这并不仅仅是传统医学研究范式的原因。候选基因法(candidate gene)之所以被采用,一部分原因是基因分型的高昂研究成本和从假说出发的科研方法。
1700229484
1700229485
研究成本是一个不可忽略的因素。1在对基因的早期生物学、医学以及行为学研究阶段,为了研究遗传序列,需要合成被称为引物(primer)的核苷酸链。由于这种研究成本很高,所以科学家在选择观察位点上非常谨慎。科学家倾向于假设某一特定基因型差异的关键在于基因组的某一特定区域。大面积排查的方法是不可行的。
1700229486
1700229487
那么科研人员如何知道自己关心的性状对应于基因组的什么位置呢?大部分情况下,基因的选取基于已经在模式生物(model organism),也就是在一些实验室动物身上进行的研究。模式生物已经为行为遗传学等复杂研究领域解决了许多难题。首先,科学家可以定制研究环境。比如,我们可以将一只小鼠置于生存压力较大的环境下,其他小鼠则置于对照环境中。我们可以让实验组小鼠在未断奶时就离开母亲,而对照组小鼠则与母亲生活在一起。环境的随机分配(或是保持各实验室中条件相同)模仿了医学中的控制随机变量实验。这就消除了我们在第二章中提到的基因可能冒领环境差异影响的担忧,例如,美籍华人既使用筷子,在某一位点上C的比例也有偏高的情况。对于模式生物,环境对于基因的影响可以通过控制环境变量来消除。
1700229488
1700229489
此外,在许多研究模式生物的过程中,遗传控制可以通过一种叫作回交(back-breeding)的方式实现。所谓回交就是指科学家让动物与其亲代或兄弟姐妹交配,这样经过几代之后就能排除大部分杂种基因,从而在实验室条件下得到一个基因几乎完全相同的群落。在这种遗传因素相同的背景下,研究人员可以通过将遗传信息转入宿主细胞,或是诱导定向突变的方式来改变某一个基因。一旦将这种变异引入生殖系(即产生精子与卵细胞的细胞),这个基因变异就将代代相传。
1700229490
1700229491
这种通过遗传手段操纵活体动物的能力带来了很多可能性。科学家不仅能够在实验室条件允许的范围内控制实验大鼠所处的环境,还可以向它们注入或关闭某些特定基因,看看会出现哪些现象。他们还可以把新基因跟已有的基因结合,形成标记基因,指示出这些基因何时在动物的何处表达出来(即合成蛋白质)。例如,绿色荧光蛋白(GFP)最初是在某些水母身上发现的,现在它在许多遗传学实验室中作为标记物被广泛使用。当我们将其他基因片段与编码绿色荧光蛋白的基因结合在一起时,如果在实验动物身上发现了荧光蛋白,就意味着我们要测定的目标基因被表达了。2这样研究人员就能判断目标基因的激活条件,比如表达所处的环境条件、细胞种类以及细胞发育的阶段等。
1700229492
1700229493
考虑到用实验动物能完成如此多深入细致的研究,研究行为遗传学的科研人员在寻找人类基因组中的重要基因时,常常把大鼠与小鼠的转基因实验数据作为参考也就不足为奇了。幸运的是,从生物界的角度来看,比起黏菌(slime molds)、深海热泉口的微生物等来说,小鼠和人类简直就是双生子,几乎一模一样。小鼠和人类在8000万年前源自同一个祖先,所以大脑结构一样,所有的基因也几乎一样(在已经研究过的4000个基因中只有10个不一样),而负责蛋白质编码的DNA序列中两者相同的比例也高达85%。3
1700229494
1700229495
更让研究行为学的学者激动的是,对我们的四条腿“小表弟”进行的表型研究已经很成熟了。我们有各种方法来衡量上瘾(就像人类的药物成瘾一样,小鼠也会对可卡因成瘾,这时它们会对进食、交配、睡眠等一切都失去兴趣,只想要更多可卡因)、社会挫败4反应等一系列与人类抑郁症类似的鼠类行为,以及与我们所说的焦虑类似的行为。科学家甚至可以衡量小鼠的认知能力和韧性(也就是勇气)。近年来,研究者认为在当今社会中,后者是一项关键的非认知技能。5
1700229496
1700229497
于是,当小鼠某个基因的变异表现出会影响其抑郁水平时,人类分子遗传学家就会决定研究人类的这个基因。在这些基因中,有一些在大脑中得到了高度表达,而且是当今许多药物疗法的作用目标。例如,经过对小鼠和人类进行广泛研究之后,有一个候选基因被确定为5-羟色胺转运体的编码基因,而5-羟色胺转运体正是抗抑郁药物百忧解(Prozac)和其他5-羟色胺重吸收抑制剂(SSRIs)的靶蛋白。多巴胺(dopamine)受体2和受体4也是这样的例子。它们是大脑奖励回路和愉悦回路的关键物质,已经查明其与注意力缺陷多动症(ADHD)有关,而且是ADHD治疗的指导激素[包括使用安非他明(amphetamine)来刺激多巴胺的释放] 。至少从理论上来说,人类行为学家通过这种方式探索基因对社会的影响是有一定依据的。
1700229498
1700229499
然而,理论是一回事,实际做起来又是另一回事。Add Health等采集人群DNA数据的多项早期调查测定了已知与大脑5-羟色胺系统和多巴胺系统相关的6~10个基因标记,其中包括单胺氧化酶(monoamine oxidase)的编码基因。单胺氧化酶是百忧解出现之前能起到抗抑郁作用的靶蛋白。很多早期研究(包括最新的一些研究)发现,这类候选基因发生的变异对小鼠行为,以及对应的人类行为有显著的影响。比如说,这些研究得出的结论之一是,单胺氧化酶A(MAO-A)基因的变异会影响人类的秉性和侵略性。6这个基因经常被称为“战士”基因(“warrior” gene)。7而多巴胺受体2(DRD2)基因和多巴胺受体4(DRD4)基因的变异也已经被证明与人类行为有关。这些研究者认为,有些人需要对其多巴胺受体所在的大脑区域进行更多刺激才能达到某一给定的反应水平,因而,这些人就会更喜欢冒险。
1700229500
1700229501
然而,我们并不能认为进行动物实验得到的结论就能简单地应用于人类。一个明显的问题就在于如何用小鼠的表型来类推相应的人类行为。我们怎么能确定使小鼠蜷缩在笼子一角的某个基因变体,就是导致人类抑郁程度超过临床阈值的等位基因呢?我们又如何能确定控制小鼠因为猫的出现或是惊叫而惊恐万状的基因,就相当于使人类在焦虑症发作时表现出强迫症和失眠的基因?另一个问题是,动物实验不仅能控制环境(比如,可以最大限度地防止各种实验不需要的噪声产生,以免干扰对基因型与表型关系的观察),还能通过使用基因型相同的动物来控制遗传背景,从而消除基因的互相影响。这种相互作用也被称为异位显性,指的是在一对基因中,只有当其中一个为某基因型时,另一个基因的变异才会产生显著效果。举例来说,DRD2基因如果只是自己发生了变异,那么细胞对多巴胺的摄入就不会受到显著的影响;但如果DRD4基因也同时发生了变异,细胞的多巴胺摄入就会出现问题。因为这两个基因是互为补充的关系,一个基因表达的受体不足时,另一个基因就会加强表达。只有两者同时出现问题时,症状才会显现。最后,候选基因法难以解决我们之前已经提过的“筷子问题”,因为被研究的单个基因变体在不同的人群和子群体中的出现概率不同,而它们之间可能存在极大的历史文化差异。
1700229502
1700229503
尽管面临许多挑战,但还是有许多研究发现候选基因在多方面有显著的影响。从抑郁与学生各科平均成绩[康利(Conley)的研究],到考试成绩与注意力缺陷多动症的联系[弗莱彻(Fletcher)的研究],其影响面还是很广泛的。8这还只是我们自己的一部分研究。毫不夸张地说,有成千上万篇已发表的论文声称发现了某基因对人类的某种行为或态度有重要作用。科研人员也不是简简单单就做出结论的,我们一直在试图解决前文提到的那些问题。例如,为了解决“筷子问题”,我们一般会将分析局限在某族裔内部,或者对照所研究基因存在的不同兄弟姐妹,从而彻底规避潜在的人群分化带来的问题。同时我们还认为小鼠的行为模式与人类的行为模式并非完全对应。两个物种表型之间蹩脚的“翻译”可能不利于我们得出正确的结论。换句话说,如果我们推断小鼠的某种行为是某基因影响的结果,并且试图把这一行为跟人类的某种行为联系起来,我们就有可能在人类身上观察不到任何该基因的作用,因为这两种行为实际上并没有太大的关联性。这就表明,这种思路下的研究可能存在很大的测量误差。
1700229504
1700229505
虽然科学家一开始激动不已,而且基于理论精心设计了研究方案,但是今天的公认结论是,大部分早期的研究结果都是假阳性,也就是说只是统计学上的巧合,并不具有真正的社会生物学意义。可是,如果我们掌握了这种理论,并用它来检验关于单一遗传变异与现实后果(如考试成绩)的假设,这难道不符合科学规范吗?难道将动物行为“翻译”为人类行为带来的偏倚总是会妨碍我们得到真阳性结果吗?我们难道不更应该担心得出假阴性结果吗?有人可能认为,得到假阳性结果在现实中几乎是不可能的,那简直相当于大海捞针,一捞就中一样。我们更应该担忧的是,我们实验了很多次,就快接近那根针了,甚至都碰到了它,可惜没被扎疼(也就是假阴性结果)。
1700229506
1700229507
只要初步了解社会科学文献的撰写、出版与获得认可的方式,我们就能对假阳性结果的汗牛充栋做出解释了。杂志社关注的只是能吸引眼球的头条新闻。几十年来,社会科学文献和数以万计的研究者使用的都是同一套数据模型,所以想有新的发现真的很难。但未来,当新的变化即基因标记被引入传统社会科学调查时,新发现肯定会像雨后春笋般出现。如此大规模的数据向我们提供了成百上千个值得研究的变量,借此去观察它们与新的信息(基因标记)是否存在统计学关联。实际上,在20年前,寻找基因与复杂人类行为之间联系的研究刚起步时,研究者感觉在这个新的领域也许能很快从数据中发现能反映真实因果关系的统计学关系。起初,科学家确实有一些成功的发现,包括载脂蛋白E(APOE)和阿尔茨海默病(Alzheimer’s disease)的关联,以及乳腺癌1号基因和乳腺癌2号基因(BRCA1/2)与乳腺癌的关联。人们逐渐意识到,还有很多强单基因效应等待着人们发现。
1700229508
1700229509
然而,把遗传学数据引入大型社科研究会引起危险且产生难以预期的副作用。与只关注某种疾病的大多数医学研究不同,社会科学的数据往往要评估上千种问题,包括收入变化情况、受教育程度、政治参与情况、考试成绩等。比如,某个基因变体有可能是影响人体生理系统(如多巴胺系统)的重要因素,如果研究者对这个变体很感兴趣,将其引入自己的调查,同时又没有明确的理论来指导调查,9那么他们就可以对基因X和结果Y(别忘了,这个数据中有1000多个测得的结果)的相关性不断地进行检验,直到“发现”了什么为止。如果研究者在全样本中一无所获,他也许会在男性、白人、(美国)南方人的样本子集中得到一些成果,但这些中间分析步骤往往不会在报告中提及。在经历了成千上万次分析之后,研究人员可能只会提到一两个显示某基因对某些性状有影响的研究结果。在这里我们也很想举个实实在在的例子,但问题是我们找不到,因为这种“毫无价值”的研究过程就像掉在屠宰场地上的碎肉,很快就被清理掉了。只有激动人心的阳性结果才有可能被发表,这种“一无所获”的研究结局只能放在书桌抽屉里落灰。科学界将这种现象称为“文件抽屉问题”或出版偏倚。10
1700229510
1700229511
除非有特别重大的发现或者引起广泛争议的结论,其他研究人员才会重复实验,检测结果的可重复性。大多数研究都没有引发争议,因为学术期刊和主流媒体都喜欢着重报道引人注目的研究发现(如“同性恋基因”),而不是重复前人研究却未得出相同结果的报告。事实证明,要想确切地证明原来的研究结果有问题是很困难的,所以这类不太引人注目的研究仅仅被视为未能实现既有结果的失败实验而已。然而更重要的是,我们在学术期刊上看到的仅仅是实际进行统计过程中的一小部分。因此,科研人员越来越被鼓励(有时是被要求)在公开的网站上预先登记自己的假设(即他们将检测哪个基因标记),以免类似的事情再次发生。11
1700229512
1700229513
因为上述种种原因,候选基因研究逐渐遭到了强烈抵制,因为它的太多结果既不稳健,也不可重复。最终,像“大多数一般智力的基因相关性报告可能都是假阳性结果”这样标题的论文出现了,12这意味着,在一个样本身上得到的结果在另一个样本身上可能不具有可重复性。行为研究学领域的候选基因研究中假阳性问题实在是太严重了,以致该领域的核心期刊现在已经不再接受这类研究的文章,即使已经在多个独立样本上进行过重复实验的也不行。
1700229514
1700229516
冲击二:全基因组关联分析
1700229517
1700229518
那怎么办呢?按照科学发展的规律,既然之前对基因与人类行为关系的研究因为经不起推敲而惨遭失败,我们是否应该就此偃旗息鼓呢?我们是否早该承认基因对人类复杂表型的影响过于偶然,受环境和遗传背景的影响又太大,而不适合作为研究课题呢?13如果我们要继续探究重要社会现象的遗传学基础,怎样做才能得到既经得起推敲又有意义的结果呢?幸运的是,就在候选基因法日益受到抨击时,基因分型的价格正在急速下降(见图3.1)。这两种趋势激励许多(但绝对不是所有的)研究人员放弃候选基因法,转而在不做理论假设的前提下检测整个基因组,看看能有什么收获。于是,候选基因法的时代黯然落幕了,取而代之的是GWAS的时代——全基因组关联分析(genome-wide association studies)。
[
上一页 ]
[ :1.700229469e+09 ]
[
下一页 ]