打字猴:1.700229507e+09
1700229507 只要初步了解社会科学文献的撰写、出版与获得认可的方式,我们就能对假阳性结果的汗牛充栋做出解释了。杂志社关注的只是能吸引眼球的头条新闻。几十年来,社会科学文献和数以万计的研究者使用的都是同一套数据模型,所以想有新的发现真的很难。但未来,当新的变化即基因标记被引入传统社会科学调查时,新发现肯定会像雨后春笋般出现。如此大规模的数据向我们提供了成百上千个值得研究的变量,借此去观察它们与新的信息(基因标记)是否存在统计学关联。实际上,在20年前,寻找基因与复杂人类行为之间联系的研究刚起步时,研究者感觉在这个新的领域也许能很快从数据中发现能反映真实因果关系的统计学关系。起初,科学家确实有一些成功的发现,包括载脂蛋白E(APOE)和阿尔茨海默病(Alzheimer’s disease)的关联,以及乳腺癌1号基因和乳腺癌2号基因(BRCA1/2)与乳腺癌的关联。人们逐渐意识到,还有很多强单基因效应等待着人们发现。
1700229508
1700229509 然而,把遗传学数据引入大型社科研究会引起危险且产生难以预期的副作用。与只关注某种疾病的大多数医学研究不同,社会科学的数据往往要评估上千种问题,包括收入变化情况、受教育程度、政治参与情况、考试成绩等。比如,某个基因变体有可能是影响人体生理系统(如多巴胺系统)的重要因素,如果研究者对这个变体很感兴趣,将其引入自己的调查,同时又没有明确的理论来指导调查,9那么他们就可以对基因X和结果Y(别忘了,这个数据中有1000多个测得的结果)的相关性不断地进行检验,直到“发现”了什么为止。如果研究者在全样本中一无所获,他也许会在男性、白人、(美国)南方人的样本子集中得到一些成果,但这些中间分析步骤往往不会在报告中提及。在经历了成千上万次分析之后,研究人员可能只会提到一两个显示某基因对某些性状有影响的研究结果。在这里我们也很想举个实实在在的例子,但问题是我们找不到,因为这种“毫无价值”的研究过程就像掉在屠宰场地上的碎肉,很快就被清理掉了。只有激动人心的阳性结果才有可能被发表,这种“一无所获”的研究结局只能放在书桌抽屉里落灰。科学界将这种现象称为“文件抽屉问题”或出版偏倚。10
1700229510
1700229511 除非有特别重大的发现或者引起广泛争议的结论,其他研究人员才会重复实验,检测结果的可重复性。大多数研究都没有引发争议,因为学术期刊和主流媒体都喜欢着重报道引人注目的研究发现(如“同性恋基因”),而不是重复前人研究却未得出相同结果的报告。事实证明,要想确切地证明原来的研究结果有问题是很困难的,所以这类不太引人注目的研究仅仅被视为未能实现既有结果的失败实验而已。然而更重要的是,我们在学术期刊上看到的仅仅是实际进行统计过程中的一小部分。因此,科研人员越来越被鼓励(有时是被要求)在公开的网站上预先登记自己的假设(即他们将检测哪个基因标记),以免类似的事情再次发生。11
1700229512
1700229513 因为上述种种原因,候选基因研究逐渐遭到了强烈抵制,因为它的太多结果既不稳健,也不可重复。最终,像“大多数一般智力的基因相关性报告可能都是假阳性结果”这样标题的论文出现了,12这意味着,在一个样本身上得到的结果在另一个样本身上可能不具有可重复性。行为研究学领域的候选基因研究中假阳性问题实在是太严重了,以致该领域的核心期刊现在已经不再接受这类研究的文章,即使已经在多个独立样本上进行过重复实验的也不行。
1700229514
1700229515 基因:不平等的遗传 [:1700229224]
1700229516 冲击二:全基因组关联分析
1700229517
1700229518 那怎么办呢?按照科学发展的规律,既然之前对基因与人类行为关系的研究因为经不起推敲而惨遭失败,我们是否应该就此偃旗息鼓呢?我们是否早该承认基因对人类复杂表型的影响过于偶然,受环境和遗传背景的影响又太大,而不适合作为研究课题呢?13如果我们要继续探究重要社会现象的遗传学基础,怎样做才能得到既经得起推敲又有意义的结果呢?幸运的是,就在候选基因法日益受到抨击时,基因分型的价格正在急速下降(见图3.1)。这两种趋势激励许多(但绝对不是所有的)研究人员放弃候选基因法,转而在不做理论假设的前提下检测整个基因组,看看能有什么收获。于是,候选基因法的时代黯然落幕了,取而代之的是GWAS的时代——全基因组关联分析(genome-wide association studies)。
1700229519
1700229520
1700229521
1700229522
1700229523 图3.1 基因分型(全基因组检测)价格的持续下降
1700229524
1700229525 资料来源:Wetterstraiid. KA. DNA Sequencing Costs: Data fioni the NHGRI Genome Sequencing Program (GSP).全文链接:www.genome.gov/sequencingcosts
1700229526
1700229527 注:如果你不想检测全部碱基对(共有30亿个),而只想使用1个基因芯片(大约包含100万个SNP)的话,那么现在的价格连100美元都不到。
1700229528
1700229529 全基因组关联分析得益于SNP基因分型芯片的问世。不同于之前根据动物实验的结果,选取人类一部分DNP片段进行检测的做法,现在SNP芯片可以在整个基因组随机检测成百上千甚至更多的等位基因(目前,大多数芯片能识别超过100万个SNP)。现在,研究者用10年前检测8个候选基因的费用就能检测100万个SNP,以此来探究它们对他所感兴趣的社会现象的影响。科学家不用再像以前那样根据动物实验来猜测该检测哪一部分基因,而是可以直接检测成千上万个基因片段——进行无假设普查,以此探究会出现哪些数据。基因芯片的设计能很好地应用于人群基因变异多态性的分析。然而,新时代带来的也不全是好消息。其中一个坏消息是,由于我们要逐一分析每个基因标记与我们感兴趣的问题是否有关联,所以统计分析的次数上升到了百万级。为了避免假阳性结果,我们必须设置一个严格的阈值才能确定结果的显著性。一般来说,如果一个事件偶然发生的概率小于1/20的话,那么它就会被认为是“真实的”。然而这个标准就相当于,100万个样本中即使有多达5万个样本出现问题,我们也能认为这仅仅是偶然所致。因此我们需要一个比1/20严格得多的统计学阈值:五千万分之一。
1700229530
1700229531 即使有了严格的统计学阈值,研究者还需要评估数百到数千个(如果还没有达到百万级别的话)统计分析的结果。如图3.2所示,各基因标记检测出的结果通常用曼哈顿图(Manhattan plot)来呈现。14如果你的检测图更像曼哈顿(有一些峰值),而不是巴黎(所有的值都很低),那就可能胜利在望了。图上的每个墨点都代表在某SNP位点发生变异时导致的效应(如20号染色体第12256号碱基对的碱基T变成A时会产生哪些影响)。各染色体上的近百万个SNP位点会按照其在染色体上的位置排列,横轴的最左边是1号染色体,最右边是22号染色体(有些研究还会加上性染色体X和Y,通常会在图表的最右边呈现)。纵轴表示的是,当观察并比较两个等位基因时,特定SNP对结果造成的影响所对应的统计显著程度——简单来说,就是造成的影响有多大。15从图3.2中可以看出,影响最大的是19号染色体最上面的一个墨点(墨迹的深浅只是为了便于区别不同染色体)。
1700229532
1700229533 检测成千上万乃至上百万个基因标记的一个好处是,研究者可以控制人群分化带来的干扰。排除起源相同的人群中变化情况趋于一致的基因标记后,我们就能更加肯定地认为,剩下的差异确实与我们感兴趣的表型有关,而不是像“筷子问题”那样,只是反映了文化的共同点而已。早期的单候选基因研究没有考虑其他基因标记,而现在研究的则是上百万个基因,所以人群结构问题可以通过统计学方法发现并消除。
1700229534
1700229535 除了能解决人群结构问题,需要比较保守谨慎的统计学阈值之外,GWAS的另一个特点就是普遍可重复。每当你发现了一个统计显著程度超过百万分之一,很有可能构成重大发现的SNP时,你必须使用另一份重复实验的样本有针对性地做数十次检测,然后再分析一遍重复实验得到的数据。无须检测很多,可以只检查在你第一次(发现这个SNP时)的数据中表现特别突出的几个基因变异。你发现只有一个(更可能连一个都没有)错误结果,而不是5万个,这样你至少就有了两个得到同样结果的独立实验。16到此为止,你的实验结果才有可能在不同时间地点都成立,而不是人为统计失误。即使这个SNP的效应在重复实验中表现出的量级由于“冠军魔咒”现象(winner’s curse)比第一次的分析结果小,甚至接近平均水平,这个发现依然是可接受的。17
1700229536
1700229537
1700229538
1700229539
1700229540 图3.2 显示一个全基因组关联分析结果的曼哈顿图
1700229541
1700229542 资料来源:Visscher. PM. Brown. MA, McCarthy, MI, Yang. J. (2012) Five years of GWAS discovery.Am J Hum Genet90(1): 7-24. Ikram, MK.et al (2010)Four Novel Loci (19ql3. 6q24.12q24. and 5ql4) Influence the microcirculationIn Vivo. PlOS One 6(11): 10.1371.
1700229543
1700229544 注:这幅图非常淸楚,不仅显示出了统计显著程度最高的SNP,还能看出所有SNP统计显著程度的高低次序。所以,如果其中有假阳性的结果,那最可能是一个孤立的点,且远高于所有相邻点,这通常是偶然巧合或基因分型技术问题导致的错误结果。而真阳性是由SNP与各实际结果的独立相关性分析得出的,通常表现为落在同一区域的一选串点,好像在向顶峰攀登一样。在统计显著程度最高的SNP周围的SNP也表现出了很高的统计学相关性,表明邻近的这个位点也跟实际结果有很大的相关性,这是由连锁不平衡现象(linkage disequilibrium)(第五章有更详细的解释)引起的,即同一条染色体的相邻两个SNP可以彼此替代。所以,越靠近统计显著性最高的点信号就越强,反之则越弱。这一点在图最右边的第19号染色体可以看得很淸楚,那里有多个统计显著性最强的SNP的墨点,颇有波洛克的神韵。
1700229545
1700229546 然而,伴随GWAS这个新方法出现的第一个令人失望的结果——候选基因研究的结果几乎都是不可重复的,或者说没有一个能达到GWAS的统计显著程度要求。这种现象的罪魁祸首主要是人群分化和出版偏倚问题。所以,我们必须重新进行反思,对行为遗传学我们到底了解多少。18
1700229547
1700229548 GWAS时代给科研人员带来的第二个失望的结果是,有些基因变异经证明确实与我们感兴趣的表型存在稳定的相关性,但是作用很小,尤其是在涉及社会和行为方面。于是,之前动辄宣称某个基因有重大作用的候选基因研究就更不可信了。当研究者放眼所有达到GWAS统计显著程度(即偶然发生的概率低于百万分之一)的基因多态性,把它们的效应(即它们对于解释人群中各种现象所做的贡献程度)加起来后发现,这个值远远达不到之前估算的加性遗传力水平。例如,最初GWAS使用SNP得出的身高遗传力只有5%,19由此产生了“遗传力缺失”问题。这个谜团引发了广泛关注,2008年还出现在《自然》杂志的封面上。20
1700229549
1700229550 一种相对合理的解释是,GWAS使用的SNP芯片通常只是涵盖了大部分,而非全部遗传变异,这是出于经济性的考虑。还有另一种理论上的可能性,即消失的90%以上的遗传力都来源于芯片没检测到的位置。我们如果转而研究含有30多亿碱基对的全基因组,可能就会发现这些失踪的遗传力,一切问题都将迎刃而解。反对者则认为,要想解决这个问题,这些罕见的等位基因必须对我们感兴趣的实际后果产生极大的影响,这不仅是因为消失的遗传力比例太大,还因为任何一个等位基因对整体变化的贡献都取决于两个因素:①这一观察到的特定位点基因变化对实际后果的影响强度和普遍程度。②这些变化确实非常罕见。即使某位点上是碱基A还是碱基G不会带来多大变化,但两者在人群中的分布是五五开,那么与下面这种情况相比,它对整体差异的解释力可能要更强一些,即在另一个位点上,碱基为C而非G,虽然会对个体造成很大的影响,但是C出现的频率只有0.1%。
1700229551
1700229552 这种区别常常使人们在解释基因标记时感到困惑。就拿与乳腺癌有关的BRCA1基因突变来说,如果一个人携带了这个有害的等位基因,一生中罹患乳腺癌的风险将是非携带者的8倍。很显然,携带了这种基因的人应该对乳腺癌格外重视——如安吉丽娜·朱莉在尚未发病时就接受预防性乳腺切除术与卵巢切除术(oophorectomy)。然而,BRCA1基因的作用只占乳腺癌整体遗传力的很小一部分,并且乳腺癌还受到许多其他遗传方面的影响。APOE4等位基因与阿尔茨海默病的关系也是如此。另外,这些致病基因其实都不算特别罕见,只不过某些表型是高度多基因化的,即受很多基因的影响。事实表明,大部分表型都是多基因化的,亨廷顿病等单基因病反而是例外。所以,即使候选基因研究中完全没有假阳性的问题,这种方法也会像打字时看一次键盘敲一个字那样低效。要想用这个方法得出社会和行为现象的遗传力,我们恐怕得用几千年时间才能做出大量的研究。正如有名的“猴子和打字机”的故事所说:假如把1000只猴子关在一个有打字机的房间里100万年,它们最终也许能够打出莎士比亚的全部作品。然而对于文学创作来说,这确实不是最有效率的方法。21
1700229553
1700229554 对于为何观察到的基因效应没有期望的大,还有一个可能的解释:我们所研究的基因效应都是“非加性”的。测得的遗传力一般被称为“加性”遗传力,因为研究者不会考虑等位基因的效应(即呈显性)可能是非线性的。已知会受到显性影响的身体性状包括棕色眼睛、深色头发、卷发、美人尖、酒窝、雀斑、有无耳垂、关节逆向弯曲等。22以镰刀型贫血为例,当致病的突变基因单独存在时对身体是有好处的,因为它可以让人不易患疟疾。但如果一个人体内该基因成对存在,那就会有不良影响。引起镰状细胞性贫血的等位基因主要存在于疟疾多发地区,原因就在于该基因的杂合子(即该基因单独存在)具有预防疟疾的作用。这是显性,或者说非线性效应(尤指杂种优势)的一个例子,这类基因对健康的效应呈现出非线性的变化趋势,有一个等位基因会提高环境适应力,而有两个基因时适应力又会(急剧)下降。
1700229555
1700229556 但是,计算加性遗传概率时已经排除了单基因显性的影响,所以引起遗传力缺失问题的并不是单基因显性。然而,其他形式的非线性效应可能会影响我们对遗传力的估计。换句话说就是基因互作效应,也就是某个SNP的效应取决于另一个SNP。我们可以再拿多巴胺受体基因来举例子。如果你的DRD2基因存在问题,那么只要你的DRD4基因功能正常,DRD2基因的问题就不会产生任何实际后果。因为这两个基因可以互补,所以你只要有一个正常工作的多巴胺受体基因就可以了。只有当这两个多巴胺受体基因都有缺陷时,表型才会出现问题,这就是所谓的异位显性。
[ 上一页 ]  [ :1.700229507e+09 ]  [ 下一页 ]