1700230700
10.现在有许多人致力于消除出版偏倚。一方面,非同行评议的网络数据库之可用性被纳入考虑,如果使用的话科研人员便可以将没得出有效结果的无用数据及结果发表在网上。bioRxiv数据库(http://biorxiv.org/about- biorxiv)就是一个例子。另一方面,科学家在进行科研分析之前可能需要在网上进行预注册,将他们的假设以及将要执行的测试登记在网上(这往往在申请科研经费之时有必要进行)。这样一来学者在进行研究之前就不得不认真考虑他们该如何去做科研,同时杜绝了“钓鱼”行为。在S. Mathôt的文章中可以看到对于预注册行为的总结(S. Mathôt,“The pros and cons of pre-registration in fundamental research,” Cognitive Sciences and More,http://www.cogsci.nl/blog/miscellaneous/215-the-pros-and-cons-of-preregistration-in-fundamental-research)。最后,也有人努力去重复实验来证明发现的真相,这种努力十分可敬。例如,“Estimating the reproducibility of psychological science,” Reproducibility Project: Psychology, Open Science Framework, https://osf.io/ezcuj/wiki/home/。
1700230701
1700230702
11.更普遍的是,科研与统计实验的预注册也存在着问题。有人担心预注册这一硬性要求可能会将许多创新性研究与奇思妙想和低质量的诱导性课题一同埋没。L. C. Coffman and M. Niederle, “Pre-analysis plans have limited upside, especially where replications are feasible,”Journal ofEconomic Perspectives29, No. 3 (2015): 81-97, http://pubs. aeaweb.org/doi/pdfplus/10.1257/jep.29.3.81。
1700230703
1700230704
12.C. F. Chabris, B. M. Hebert, D. J. Benjamin, J. Beauchamp,D. Cesarini, M. van der Loos, M. Johannesson, et al.,“Most reported genetic associations with general intelligence are probably false positives,”Psychological Science23, No. 11 (2012): 1314–1323.
1700230705
1700230706
13.考虑这样一个有趣的观点:你若生在贫民窟,侵略性的基因会把你送进监狱;你若生在富人区,它则会让你走向成功。
1700230707
1700230708
14.这张图的好处在于,它不仅把统计学意义上最显著的SNP显示了出来,而且将它们按顺序排列。因此,如果得到假阳性结果,它很可能显示为一个孤立的点,游离于临近区域之外。这是因为假阳性结果很可能只是由偶然因素所导致,或者干脆就是基因分型的误差。然而如果测得的结果是真实的,那么很可能在图上同一位置有许多点,呈现出有坡度的峰状。由于不同SNP与性状之间存在关联性,这些独立测试的结果就会以点的形式像这样分布。位于那些最重要的点附近的其他点也会强烈体现出其关联性,这就表明图上区域与性状变异有确切的关联。这是由于连锁不平衡现象,同一染色体上相邻的基因可以作为彼此的代理信号发挥作用,在附录6中有对这一现象更加详细的讨论。所以越接近关键点,信号就越强;反之亦然。在19号染色体的SNP处我们可以清晰地看到这一现象(图3.2右端)。
1700230709
1700230710
15.Y轴显示的是P值的对数值(取负的以10为底的对数),也就是该结果可能来自随机抽样误差的概率。这样处理的目的是让较小的概率看起来“大一些”,整齐一些。图中虚线表示全基因组检测的P值阈值为5×10-8。
1700230711
1700230712
16.如果所期望的表型或其他结果只出现在了一个样本中,研究人员往往会采取一种不可取的办法:将该样本随机分成两半,然后证明期望结果在两个样本中都成立。
1700230713
1700230714
17.从观察样本中选择最佳SNP会导致“冠军魔咒”现象。这种现象会使重复实验样本的相关效应回归平均值。我们可以从这篇文章中找到例子:L. Xu, R. V. Craiu, and L. Sun, “Bayesian methods to overcome the winner’s curse in genetic studies,”Annals of Applied Statistics5, No. 1 (2011)
:201–231.
1700230715
1700230716
18.虽然整体令人失望,但也有一个重要的例外——FTO基因。众多研究已经可靠地表明,该基因的差异能够预测BMI,以及多个对腰围有影响的中介行为。
1700230717
1700230718
19.T. A. Manolio, F. S. Collins, N. J. Cox, D. B. Goldstein, L. A. Hindorff,D. J. Hunter, M. I. McCarthy, et al., “Finding the missing heritability of complex diseases,”Nature461, No. 7265 (2009): 747—753.
1700230719
1700230720
20.B. Maher, “Personal genomes: The case of the missing heritability,”Nature News456, No. 7218 (2008): 18—21.
1700230721
1700230722
21.T. A. Manolio, et al., “Finding the missing heritability.”
1700230723
1700230724
22.“Dominant and recessive characteristics”.http://www .blinn.edu/socialscience/ldthomas/feldman/ handouts/0203hand.htm。例如,如果在某个位点上,杂合子GA与纯合子GG差别不大,但纯合子AA会带来显著差异,那么该位点就不符合加性遗传力模型。其他非线性效应下也是如此,比如,GG和AA相同而与GA不同。如果人群中大部分性状都是这种非线性的情况,那么简单的加性模型就会忽略它们。应当提及的是,双生子等多种模型可以刻画非线性模式。
1700230725
1700230726
23.T. D. Howard, G. H. Koppelman, J. Xu, S. L. Zheng, D. S. Postma, D. A.Meyers, and E. R. Bleecker, “Gene-gene interaction in asthma: IL4RA and IL13 in a Dutch population with asthma,”American Journal of Human Genetics70,No. 1 (2002): 230—236.
1700230727
1700230728
24.这类情况下,根据相关性估测的整体加性遗传力(比如,ACE模式中的那样)会被基因间相互作用放大。有一些实例展示了这类情况:O. Zuk, E. Hechter, S. R. Sunyaev, and E. S. Lander, “The mystery of missing heritability: Genetic interactions create phantom heritability,”Proceedings ofthe National Academy of Sciences109, No. 4 (2012): 1193–1198。
1700230729
1700230731
1700230732
26.我们的确能够在基因组中积累中性(或者说意义不明、无义的)变异。当这些变异在后代中满足条件时,它们可能就会被“活化”,并因环境不同产生不同的影响。也有一些原本是中性或无义的变异达到阈值从而产生可观效应的情况。对于肥胖症、精神分裂症等慢性疾病而言有一种常见的理论:你的发病是因为环境变化恰好达到了让那些中性或无义变异发挥效果的程度,因此你可能会突然罹患某种“遗传病”。这可以解释怪异症状的突发问题,但无法解释亲兄弟在遗传力方面彼此接近的问题。这一问题最初在康拉德·哈尔·沃丁顿(Conrad Hal Waddington)的研究中被提及。他将发育中的果蝇暴露在某些环境下(例如,在关键发育时期提高温度),然后就发现其表型有所变化,比如,多长了一对翅膀之类的。他接下来把自身没有暴露于特殊环境,但是与暴露于特殊环境并表现出变化的果蝇同源的果蝇挑选了出来,加以培育。几代之后,这些果蝇的后代也出现了多翅性状,而且其间环境没有任何突发改变。这些果蝇从头到尾都没有被处理过,这种现象是由每一代的同源果蝇间接筛选导致的。换句话说,中性或潜在的遗传变异始终存在,只是受到了环境突然变化的抑制而未能表达[C. H. Waddington, “Canalization of development and the inheritance of acquired characters,”Nature150 (1942): 563–565, and “Genetic assimilation of an acquired character,”Evolution7 (1953): 118–126]。
1700230733
1700230734
27.据推测,长颈鹿最初的体形与马相似,并不特别高,与它亲缘关系最近的物种霍加狓(okapi)也确实与马的体形类似。为了取食高处的树叶,一部分个体努力伸长脖子。久而久之,即便在休息中它们也会设法伸长颈部。当它们生育后代时,其子代的颈部可能就会变长。虽然子代颈部可能不及亲代穷其一生所达到的那样长,但与在低处取食植物的同辈相比,它们的颈部显然更长。随着一代又一代的个体对高处食物的追求,这样的变异渐渐积累,最终使它们的体形变成了如今长颈鹿的样子。
1700230735
1700230736
28.A. Okbay, J. P. Beauchamp, M. A. Fontana, J. J. Lee, T. H. Pers, C. A.Rietveld, P. Turley, et al., “Genome-wide association study identifies 74 loci associated with educational attainment,”Nature533, No. 7604 (2016): 539–542.
1700230737
1700230738
29.A. R. Wood, T. Esko, J. Yang, S. Vendantam, T. H. Pers, S. Gustafsson,A. Y. Chu, et al., “Defining the role of common variation in the genomic and biological architecture of adult human height,”Nature Genetics46 (2014)
:1173–1186, http://www.nature.com/ng/journal/ v46/n11/full/ng.3097.html.
1700230739
1700230740
30.N. Chatterjee, B. Wheeler, J. Sampson, P. Hartge, S. J. Chanock, and J.-H. Park, “Projecting the performance of risk prediction based on polygenic analyses of genome-wide association studies,”Nature Genetics45, No. 4(2013): 400-405; F. Dudbridge, “Power and predictive accuracy of polygenic risk scores,”PLoS Genetics9, No. 3 (2013): e1003348.
1700230741
1700230742
31.H. D. Daetwyler, B. Villanueva, and J. A. Woolliams, “Accuracy of predicting the genetic risk of disease using a genome-wide approach,”PLoSOne3, No. 10 (2008): e3395.
1700230743
1700230744
32.归集法是很有用的。归集法将被测SNP取样,将其与人类基因组密度工程(Human Genome Diversity Project)给出的基因组参考数据对比(此基因组经过完全测序,几乎每个碱基对都在人群中存在大量变异记录)。基于这些SNP在参考基因组中的概率数据,我们可以对实验未检测的SNP概率值进行分配。由于连锁不平衡,这种做法是可能的。LD变种在染色体局部遗传,而给定SNP是某种变种的概率值,与周边者息息相关。参考基因组被测序的程度越高,SNP芯片的分型就越密集。人群中由于瓶颈效应或漂变存在的变异越少,归集的准确性也就越高。在附录6中我们会讨论归集与种族问题是如何直接相关的。对于当前的研究目的,重要的是记住这一点:这一方法发展得越来越好,但归集并不等同于对每个人每个位点的基因进行测序。
1700230745
1700230746
33.Kaiser Permanente Research Program on Genes, Environment, and Health, Division of Research, Kaiser Permanente, https://www.dor.kaiser.org/external/DORExternal/rpgeh/index.aspx.
1700230747
1700230748
34.D. Conley, B. W. Domingue, D. Cesarini, C. Dawes, C. A. Rietveld,and J. D. Boardman, “Is the effect of parental education on offspring biased or moderated by genotype?”Sociological Science2 (2015): 82—105.
1700230749
[
上一页 ]
[ :1.7002307e+09 ]
[
下一页 ]