1700229834
各大洲祖先是真的,说明了什么?
1700229835
1700229836
我们现在知道的是,各大洲人类的祖先有很大的遗传差异(这些差异和种族分类相关,但多数时候是相反的)。我们现在试图回答一个更加具有争议性的问题:当代美国种族间各项指标的差异可否用祖先间的差异来解释呢?有没有一些基因型差异凌驾于环境差异之上,直接导致了教育水平和收入水平的差异(关于环境因素的部分请参阅附录5)。我们已知,不同祖先的人群间有很多基因的频率不同,但是有证据表明,这些不同并没有给智商等指标带来显著的影响。但是是否存在这样一种可能:在黑人与白人之间的这些小小的差异累加起来,就形成了足以影响智商的结果呢?我们又该怎样观测这样的变化呢?
1700229837
1700229838
这是一个“令人不愉快的”,总是被意识形态左右的问题。作为科学家,我们有充分的理由绕开这个问题。换句话说,这些研究带来的破坏性比它们的价值更高。26现在我们提出这个问题,就是希望以一种科学的而非意识形态的角度来看待它。虽然把研究限制在某一个种族内会更简便易行,但如果我们的书中只涉及社会遗传学,而非它和种族的关系,那显然是在逃避问题。在围绕美国论述种族/大洲起源的一章中,如果我们不谈基因在解释社会经济结果方面的潜在作用,也不免有隐瞒事实之嫌。此外,略过这些内容显然会背离本书的主旨:负责任地将遗传学与社会科学结合起来。最后即最重要的是,随着遗传学和社会科学交叉研究的大发展,终有一天会有人去研究种族、基因和社会成就间的关系,与其等着一帮种族主义学者借题发挥,还不如我们现在就向公众揭示到底什么样的假设是合理的,什么样的数据又是科学的。
1700229839
1700229840
一个很容易想到的处理方式是,直接比较白人和黑人基因组中的微小差异,看他们是否具有“加性”,以及“加和”之后,这些遗传差异是否能够解释重要的表型差异,比如,教育水平。这里有至少两种进行“加和”的方式:第一种读者应该比较熟悉,就是多基因分数;第二种则会在后面详细介绍,即主成分法(principal components)。
1700229841
1700229842
如果我们在黑人和白人间比较教育水平的多基因分数,能通过结果来说明就学儿童的差异是由基因决定的吗?进行这一比较要面对许多困难,有些是技术上的,有些是概念上的。让我们先来看技术问题,因为这个似乎更好解决。首先,计算多基因分数需要所有(至少绝大部分)欧洲先祖的基因样本,由此引发的关于数据有效性和缺失问题不容忽视。由于计算多基因分数时采集的环境数据不包含黑人的生活环境和教育环境,可想而知,多基因分数在黑人群体中的预测表现会大打折扣。数据缺失问题的产生则是由于黑人群体有很多“特有基因”。而欧洲人的祖先并没有这些基因,因此,多基因分数在这一方面无能为力(一个相关的问题是剪裁基因数据,详见附录6)。如果我们有一个大型的非洲人全基因组数据库(如50万规模的UK Biobank),我们也许能从理论上规避这两个问题,构建教育水平的多基因分数。
1700229843
1700229844
即便我们可以为每个群体算出一个多基因分数的值,欧洲后裔和美国黑人的结果也是风马牛不相及。这些结果或许能帮助我们理解种族内教育分层的现象,但是对跨种族研究毫无意义。这是因为,只要试图比较两个各自独立计算出的数据,“筷子问题”就会存在:对两个群体间的所有可见差异,我们都应该将主成分提取出来,以排除群体间潜在的环境差异影响。
1700229845
1700229846
另一种可以用的方法——直接追溯先祖,然后评估其效应——也有严重的不足。乍听上去,这个方法是可行的。我们已经知道,每个大洲的“生态群”(cotinental clines),或者叫“种族”有着不同的遗传性状。值得注意的是,差异的主成分与选取群体高度相关(如欧洲最主要的两个地理主成分是东西和南北)。27主成分分析(PCA)是统计学上的一种手段,可以给出在单个维度中造成最大变化的那个变量。在有基因数据的情况下,第一主成分(PC1)可以有效把握SNP中跨基因组相关的性状,并由此可靠地追溯祖先。第二主成分(PC2)描述的是去掉第一主成分之后对差异造成最大影响的因素,或者叫维度。28如果我们知道你在这两个维度上的得分,我们就可以对你的种族和起源做出有效(但不可能完全确定)的估计。增加额外的主成分可以提高预测的准确性,我们甚至可以在同一个种族内再进行分类,采用其他的方式也能得到相似的结果。
1700229847
1700229848
在遗传学研究中,这些主成分常被用于划分人群(血统)结构,以避免前文提到的“筷子问题”,这个问题导致在确定结果的根源时,环境、文化、历史差异会与遗传差异相混淆。如我们在第三章中所描述的,在GWAS研究中,研究者试图利用回归估计手段,从统计上将单个单核苷酸多态性与表型建立起联系。为此,研究者通常需要10个以上的主成分,以确保被试者基因组中余下的部分基本一致。主成分的另一个作用是跨时跨地比较不同人群的基因组,以追踪其混合模式与历史迁移模式。29
1700229849
1700229850
然而,新兴的第三种主成分使用方式则存有争议,即不仅把它用作控制变量,还作为主要研究对象;也就是说,用“祖先”的主成分来直接研究社会经济中的差异。这样的研究有一个方法论上的优势:虽然种族分类是离散的,而且基本采用降格继嗣原则,但血统成分却构成了一个连续的谱系。人为定义的离散种族类型——黑人、白人、拉丁裔、亚裔、印第安人、其他,不仅涵盖的基因型范围很大,而且混合方式也多种多样,尤其是在美国这样的移民国家中。在黑人群体中非洲、欧洲血统各占一定的比例(也有一定的印第安人血统,但比例较小)。事实上,所有自称是黑人的美国人中,欧洲血统平均占到了10%。30
1700229851
1700229852
虽然用主成分分析来研究祖先情况是有先例的,但我们还是应该十分谨慎。31我们需要在这方面深入研究的原因有如下两个。第一,对于遗传学和社会科学交叉学科的研究者来说,它指出从种族分类转向大洲祖先研究的一个清晰方向(与医学和生物学的相关进展类似)。第二,我们相信自己可以开启对这一思路中存在的问题的阐述,帮助后人避免过往研究中的滥用和误用。
1700229853
1700229854
主成分分析无法告诉我们到底是哪些基因影响着智力,然而它可以告诉我们的是,非洲血统的比例(或者欧洲血统的比例)与智商和教育水平等表型有无关系。我们不关心哪个基因决定认知能力,而是去研究一个有20%欧洲血统的美国黑人和一个有4%欧洲血统的美国黑人在认知测试中的表现(我们也可以在白人群体中做这样的研究,但白人中的非洲血统比例少得可怜)。
1700229855
1700229856
这种方法的主要困境是:因为我们研究的变量是主成分,“筷子问题”依然存在,即我们如何确定是祖先的基因标记,而不是与之相关的历史、地理因素决定了其智力水平?比如,美国最南部各州依然是美国黑人最集中的地区,而密西西比州则是黑人比例最高的州。而且,密西西比州与最南部各州也是美国学校最糟糕的区域之一,黑人学校、白人学校都一样。所以,我们也许应该专门研究“位于密西西比州”这一变量的影响(假设与美国其他地方相比,这里的非裔具有更多的非洲血统)。事实上,最近的一篇文章显示,美国黑人中含有的欧洲血统比例和向西、向北的迁徙存在关联——在美国西部和北部,黑人所处的社会环境更好。32或许我们应该考虑家庭背景的因素,因为欧洲血统较多通常意味着家庭环境较好。不论我们考虑并试图排除多少因素,主成分中总是会存在一些无法观察到的环境因素。
1700229857
1700229858
但是,或许有另一种方法来研究遗传差异的影响。尽管家庭成员间的主成分大多是相同的,33但他们在各个成分上的值还是不尽相同。34实际上,在两组大规模研究中,在第一主成分上,兄弟姐妹间的相关性为0.95;第二主成分则是0.9。35在全美青少年与成年健康状况纵向研究中,兄弟姐妹间的相关性超过0.98。这意味着家庭成员间还是有一定区别的,尽管微不足道。在第三章中我们讨论过,通过考察家庭成员间的遗传差异,我们可以解开基因与环境的戈尔迪死结(Gordian knot)。兄弟姐妹的等位基因也会有不一致,例如,我的一个等位基因上有一个A,而我同父同母的妹妹则是G,这样的随机过程会导致兄弟姐妹间的某些位点上基因型不同。考察兄弟姐妹间的差异,一方面可以解决“筷子问题”,另一方面也有助于评估多基因分数和主成分的因果效应。36
1700229859
1700229860
该方法的逻辑为:通过考察兄弟姐妹间的血统差异,并研究这些差异与认知能力间的关系,我们或许可以解决“筷子问题”,同时避开我们还不知道哪些基因起决定作用的问题(详情参阅附录6)。37
1700229861
1700229862
然而这个方法同样有两个问题。第一,我们需要巨大的样本量。因为对象间主成分的相关性高达98%,发现差异所需的有效样本量要比从随机群体中分析差异时大50倍。第二,即便我们获得了如此大的样本量,发现了预期的差异,那又怎么样呢?假设我们发现非洲血统的比例——相应主成分的值——和认知能力呈负相关。这样的结果又会引发另外一个问题:这种影响是如何产生的?我们依然不知道大脑结构的差异能否在测试中体现,但我们确切知道的是,血统会在外貌上有体现。因此,即便是在家庭内部,我们也可以打赌说非洲血统更多的孩子头发更黑、更卷,而且拥有更多西非面部特征。甚至可能还有一些在美国尚未与种族联系起来,但实际上与血统相关的生理指标存在,如身高。
1700229863
1700229864
这些生理指标之所以重要,是因为它们把我们带回了原点。换句话说,当赫恩斯坦和默里下结论说,黑人在认知能力上弱于白人的时候,他们假定这一指标完全由先天决定。也就是说,他们认为遗传差异造成了中枢神经系统的差异,而与环境条件无关。但是,就目前的各种方法而言,比如,研究兄弟姐妹间的差异,我们还不能将独立于环境的纯生物学效应(即它们不会作为中介变量影响其所处的社会环境)和与社会系统发生相互作用的遗传效应(如肤色较浅的人会受到奖励)区分开来。认知差异可能确实是由基因决定的,但是从基因到智商之间的联系却是社会性的,而非生物性的。肤色更深的孩子有可能经常被警察呵斥,被老师、父母认为是愚笨的,这都会对孩子的认知能力产生质的影响。总之,即便基因能预测族群的智商值,那也可能只是因为基因预测了该族群受到的对待方式。
1700229865
1700229866
从杜波依斯(W.E.B. Du Bois)时代开始,美国黑人(也包括白人和拉丁裔社区)中间就存在“以肤色定等级”(pigmentocracy)的现象。最近的研究表明,这一现象不是美国特有的,它也出现在巴西、南非等拥有混血人口的国家。我们可以先去测量肤色指标,然后将其排除。但是在生活中,种族印记极其深刻,几乎不可能完全排除。而且很多时候,我们都没有意识到它的存在。如上所述,非洲或欧洲血统与身高有关,而身高更高的人可能会在学校待遇更好,在家里获得的营养更充足,等等。即使我们不把身高作为区分种族的决定性因素,那也不能说明这和其他有显著差异的性状没有任何关系。
1700229867
1700229868
为提高准确性,问题的反面也是需要探讨的。我们并不能说明基因型差异不能从生物学角度解释测试结果的差异。血统遗传差异可能以一种我们目前尚未发现的方式影响着中枢神经系统的功能。甚至控制黑色皮肤或者鼻子形状的基因有可能在大脑中有着其他的作用(一因多效),而不仅仅是影响人体外貌。结合已有的结论,最核心的解释可能是一个基于人群区分的动态模型。
1700229869
1700229870
正如我们在上文中提到的,找到一个明确的、科学的方法几乎是不可能的。而这与某些学者随意做出的结论——遗传因素可以解释白人与黑人智力测试的分数差距——形成了鲜明对比。简要介绍了分析遗传学的方法后,我们希望这样的讨论可以警示科学家该如何对待涉及种族、基因和智力的研究。随着数据的增加,这一领域无疑会有更多大胆的尝试。因此,我们既要努力打磨问题,提出解决方案,也要避免重蹈覆辙,以致有些人把模糊的证据用于给伪科学辩护。
1700229871
1700229872
话虽如此,过往研究中的疑点并不意味着在种族分析中应用遗传学方法总是有害的。通过对基因型变量的控制,我们实际上可以更清晰地了解社会过程的影响,比如,歧视现象。也就是说,只要我们将人群间的生物或遗传差异设为控制变量,从而将它们的影响排除在外,环境(非遗传)因素的意义就会更加突出,例如,结构性的种族歧视。控制遗传差异排除了实际后果中的先天因素。例如,在一个之前进行的实验中,我们研究了同卵双生子出生时的体重差异对婴儿死亡率的影响,结果是它对黑人的影响比白人高得多。由于我们排除了两个孩子遗传差异和孕期母亲行为的影响(母亲的所有行为都会同时影响两个孩子),结果表明,新生儿健康状况的种族差异是引起死亡率差异的主要原因。38或者,如果我们对肤色和健康的关系感兴趣,我们可以比较肤色不同的兄弟姐妹,同时保证他们的遗传差异为一个定值。这样的话,假设我们发现肤色与高血压存在关联性,那么就对与肤色相关,而且可能会直接影响血压的遗传(和家庭病史)差异进行个体间比较,这种研究就能更有力地证明,这种关联的原因是肤色歧视带来的社会压力。39
1700229873
1700229874
在本章当中,我们进行了一场思维的探险,结果证明:常用的政府种族定义是不可靠的社会建构,不符合实际的遗传学分析结果。然而,我们也承认不同大洲祖先的比例是有生物学意义的,虽然这与人群选择有关。随着获取遗传数据越来越便捷,种族和遗传祖先的不一致可能会引发对种族理论的修正。也就是说,当许多白人意识到他们有非洲血统,而许多黑人也发现自己有欧洲人祖先时,“一滴血原则”可能就会被更复杂、更细致的分类方法所替代。另外,正如社会学家安·莫宁(Ann Moring)所说,“我们都知道种族融合。早在19世纪,人口普查单位就因此列出了‘1/4黑人’,甚至‘1/8黑人’这样的项目。但即使如此,‘一滴血原则’并未偃旗息鼓,反而在外界对其的反应中越发强化”。40
1700229875
1700229876
面对种族融合的问题,科学知识也许比简单的、朴素的认识更能把问题讲清楚,权威性也更强。当然,也可能不是这样。不管是哪一种情况,正如在择偶、社会流动和生育等方面一样,社会遗传学都揭示了隐藏在表象之下,与直觉相悖的种族奥秘。在如此强大的工具面前,我们显然不能望而却步。
1700229877
1700229878
1700229879
1700229880
1700229881
1700229882
[
上一页 ]
[ :1.700229833e+09 ]
[
下一页 ]