1700229809
祖先差异是重要因素还是随机误差
1700229810
1700229811
人种论在科学的角度是站不住脚的。然而,大洲祖先的差异是有遗传学根据的。但是大洲间的遗传差异对当代社会又有什么意义呢?现在,我们有必要打破一些左右两派同样在大肆宣扬的对基因差异的神话了。“左派”的许多人倾向于忽略人种之间的基因差异,指出这些人种内的基因差异大于人种间的差异。他们经常引用的事实是,所有人类的基因组有99.9%是一样的,并没有哪个族群含有其他族群没有的基因(比如,编码蛋白的基因)。这些说法都是错的。毕竟,我们和大猩猩的基因相似度也高达98%,与尼安德特人的基因相似度也有99.7%。这2%(或0.3%)的差异是多么微不足道啊!
1700229812
1700229813
简单来说,与其谈总体差异,不如具体基因具体分析。想象一群FOXP2基因(所谓的语言基因)发生了变异的人,他们体内的转录因子(transcription factor)是失效的。这些人没有用语言交流的能力。事实上,这个基因的功能被首次发现是在研究一个患遗传病的英国家族时,这个家族三代人中有一半患有严重的言语运动障碍(verbal dyspraxia)。这个家族和邻居有99.9999%的遗传相似性,但就是那0.00001%的差异产生了巨大的影响。虽然整体高度相似,但局部差异还是会产生巨大的影响,这种效应存在于各种生物中。通过在实验室里人工修改4个基因,科学家可以让拟南芥(一种草本植物,株高20厘米左右)长成高大的乔木。就好像是娱乐节目《听声识曲》(Name that Show)的遗传学版本,只需要几个基因就可以彻底改变生物的表型(虽然像SNP这类常见的变异在人群中的影响较小,但是某些基因的改变或失效会对表型造成重大影响。即便是由多个基因控制的表型,比如侏儒症或者智力障碍)。
1700229814
1700229815
过分强调所有的人类拥有同样的基因型(即使他们的表型不同)会忽视这样一个事实:生物学意义上的进化并非只体现在基因的增减上,而更多地体现在对基因表达的调节上——对产物、时机、位置,甚至表达与否的调节。在人类基因组计划(HGP)启动时,对人类总基因数的预计为10万个左右。毕竟,我们比只有32000个基因的玉米高等多了。17测序的结果让人大跌眼镜,人类的总基因数只有不足2万个。所以说,绝大多数人类的差异来自这2万个基因在体内的具体调节。同一个基因可能在大脑中表达,也可能在肝脏中。某些基因只有在受到细菌侵袭时才会被激活,而一碗热面条又会关闭这个基因。每个基因就像是一个努力工作的家长,白天在单位忙前忙后,下班之后匆匆回家做饭,还要火急火燎地去开家长会。
1700229816
1700229817
人类有2万个基因这一事实并没有排除另一种可能——表型的差异来自基因组调控区变异(如启动子、增强子、小RNA和其他分子开关)。相比研究人们是否拥有同样的蛋白,更有意义的是研究等位基因是否一致。在考察了某个族群是否拥有其他族群没有的等位基因后,我们得出的结论是肯定的。非洲人拥有最多的特有等位基因,这也是该地区巨大基因多样性的体现。问题在于,没有证据可以排除这些特有等位基因在群体差异中的影响。
1700229818
1700229819
“左派”的第三个观点是:从进化的角度,人类发展的时间还太短,不足以让有明显效果的差异出现。史蒂芬·杰伊·古尔德(Stephen J.Gould)有一句名言:四万年来,人类没有发生任何生物学上的变化,所有的文明都是用同样的头脑和躯体建造的18。根据此种说法,人类进化史在现代人从东非起源之后就结束了。毕竟和原始人漫长的历史相比,6万年的时间不过是弹指一挥。如果我们要分析其他大洲人类的差异,时间尺度就更小了。然而,族群间的差异既有可能从对原始突变的选择中产生,也有可能从一些多基因决定的性状中产生,因为其中已经积累了很多可供选择的变异。我们已经知道,身高和认知能力具有很强的多基因性,数以千计的小小差异都影响着最终的结果。如果群体中的高智商者生育率更高,可以预见几代之后群体的平均智商水平就会有质的飞跃(假定高智商带来的生存优势足够强)。19从这个角度来看,6万年似乎已经是地老天荒了。20只要不同的表现——不只是智力,还有勇气、自律等——会带来不同的生存能力,可以想见遗传性差异很快就会发生,不过需要几千年。21
1700229820
1700229821
事实上,这正是某些有争议的学者所推崇的理论。比如,人类学家格雷戈里·科克兰(Gregory Cochran)和已故的亨利·哈本汀(Henry Harpending)在他们的著作《一万年爆发》(The 10000 Year Explosion)中指出的,新石器革命(Neolithic Revolution)和定居文明的开始使社会结构,而不是自然环境,成为群体遗传性改变的主要动力。结果就是,当今的很多差异都可以追溯到农耕时代起日益增长的选择压力。这样的压力使擅长规划的人比强壮的狩猎者更具优势。在给定的一个社会中,成熟农业兴起的时间是与族群适应新生活方式的程度密切相关的。他们的理论虽然能自圆其说,但是没有经过数据的检验,仅仅依赖一些偶然的证据。尽管最近的研究显示,技术的发展并没有让进化停滞,但我们并不知道现代社会中自然选择的驱动力是什么,以及它会带来哪些影响。22换句话说,虽然人类还在进化,在自然选择的压力下不断分化,但是自然选择在各个大洲上仍然是相同的,不受社会等方面的影响。
1700229822
1700229823
在人类进化以及群体差异的领域内,“左派”的观点只占了半壁江山。“右派”也有自己的一套神话。比如,尼古拉斯·韦德(Nicholas Wade)是《天生的烦恼》(A Troublesome Inheritance)的作者,他关注分布呈现地理差异的那些基因位点,试图以此来解释群体间的差异。诚然,有一些基因,如FOXP2,存在他们所说的那种强力效果,但他们恰恰错在不是每个基因都是这样的。例如,韦德经常举的例子是MAO-A基因拷贝数的差异,他认为这是一个“战士基因”。理由是经过对一些志愿者的基因分析发现,这个基因的存在会增加暴力倾向。然后他们说这个“暴力基因”在黑人中出现的频率更高。然而,正如我们在第三章中阐述的,这样的候选基因实验——尤其是韦德用的这个——经不起重复测试的考验。即便通过了,这样的分析也只能说明群体差异中的一些细枝末节,并不能以此证明种族间存在不同的基因模式。
1700229824
1700229825
“右派”的另一个错误是过分相信自然选择而忽视了遗传漂变。23在自然选择中,不同的基因会使个体具有不同的存活率,从而逐步影响群体的基因型。
1700229826
1700229827
而在基因漂变中,遗传变异是随机产生的,与生存优势关系不大。这一过程会为不同地区、不同时期的族群(像是美国白人和美国黑人)打上不同的“标记”。不同族群间的表型——比如,身高或智商也可能出现差异,但那是由和遗传差异密切相关的环境因素导致的。
1700229828
1700229829
随着环境的变化,纯化选择正在发生。一个非常明显的例子是镰刀型红细胞。具有镰刀型红细胞的个体有抵御疟疾的能力。控制这一性状的基因只分布在非洲中西部的部分地区。而非洲中西部恰恰是疟疾发病率最高的地区之一(其他疟疾高发区发展出了其他抵抗疟疾的基因,如G6PD)。另一个例子是体形的大小。根据阿伦定律(Allen’s Rule),热带地区的恒温动物耳朵和四肢较大,以利于散热;寒冷地区则恰恰相反。这一效应在人类和其他恒温动物身上都有所体现。
1700229830
1700229831
因为我们在身体结构上发现了环境和基因的影响,所以有些人认为,人类行为和心智也可以这样简单地去分析,这是许多基因决定论者犯的另一个错误。他们犯了效度的错误,盲目推广小样本下的结论是无效的。在一些由少数基因决定的性状中,我们可以清楚地看到基因型与自然选择的关系,如肤色、瞳色和乳糖耐受等。但是像认知能力这样由众多基因控制的性状,这一关系就不那么明显了。在我们研究体形的时候,四肢长度的变化和阿伦定律预测的基本一致,但是与身高不同,四肢长度这一性状只由少数几个基因控制(主要由HOX家族基因控制)。24实际上,身高并不符合纬度分布的规律。除了行为表现的多基因型和复杂性,用遗传学来解释种族兴衰的理论并不可信。1000年时光足以让人群中的遗传差异充分表达,但200年或许就不够了,50年的可能性就更小了。25因此,要想解释生活水平和社会形态的差异,我们需要比遗传差异更有解释力的理论,可能是制度差异,也可能是法律差异,等等(我们会在第六章继续讨论)。目前的研究认为,遗传差异虽然也是国家、种族和民族间经济与社会差异的一个可能解释,但可靠程度很低,而且难以证实。接下来,我们就要看看到底有多大难度。
1700229832
1700229834
各大洲祖先是真的,说明了什么?
1700229835
1700229836
我们现在知道的是,各大洲人类的祖先有很大的遗传差异(这些差异和种族分类相关,但多数时候是相反的)。我们现在试图回答一个更加具有争议性的问题:当代美国种族间各项指标的差异可否用祖先间的差异来解释呢?有没有一些基因型差异凌驾于环境差异之上,直接导致了教育水平和收入水平的差异(关于环境因素的部分请参阅附录5)。我们已知,不同祖先的人群间有很多基因的频率不同,但是有证据表明,这些不同并没有给智商等指标带来显著的影响。但是是否存在这样一种可能:在黑人与白人之间的这些小小的差异累加起来,就形成了足以影响智商的结果呢?我们又该怎样观测这样的变化呢?
1700229837
1700229838
这是一个“令人不愉快的”,总是被意识形态左右的问题。作为科学家,我们有充分的理由绕开这个问题。换句话说,这些研究带来的破坏性比它们的价值更高。26现在我们提出这个问题,就是希望以一种科学的而非意识形态的角度来看待它。虽然把研究限制在某一个种族内会更简便易行,但如果我们的书中只涉及社会遗传学,而非它和种族的关系,那显然是在逃避问题。在围绕美国论述种族/大洲起源的一章中,如果我们不谈基因在解释社会经济结果方面的潜在作用,也不免有隐瞒事实之嫌。此外,略过这些内容显然会背离本书的主旨:负责任地将遗传学与社会科学结合起来。最后即最重要的是,随着遗传学和社会科学交叉研究的大发展,终有一天会有人去研究种族、基因和社会成就间的关系,与其等着一帮种族主义学者借题发挥,还不如我们现在就向公众揭示到底什么样的假设是合理的,什么样的数据又是科学的。
1700229839
1700229840
一个很容易想到的处理方式是,直接比较白人和黑人基因组中的微小差异,看他们是否具有“加性”,以及“加和”之后,这些遗传差异是否能够解释重要的表型差异,比如,教育水平。这里有至少两种进行“加和”的方式:第一种读者应该比较熟悉,就是多基因分数;第二种则会在后面详细介绍,即主成分法(principal components)。
1700229841
1700229842
如果我们在黑人和白人间比较教育水平的多基因分数,能通过结果来说明就学儿童的差异是由基因决定的吗?进行这一比较要面对许多困难,有些是技术上的,有些是概念上的。让我们先来看技术问题,因为这个似乎更好解决。首先,计算多基因分数需要所有(至少绝大部分)欧洲先祖的基因样本,由此引发的关于数据有效性和缺失问题不容忽视。由于计算多基因分数时采集的环境数据不包含黑人的生活环境和教育环境,可想而知,多基因分数在黑人群体中的预测表现会大打折扣。数据缺失问题的产生则是由于黑人群体有很多“特有基因”。而欧洲人的祖先并没有这些基因,因此,多基因分数在这一方面无能为力(一个相关的问题是剪裁基因数据,详见附录6)。如果我们有一个大型的非洲人全基因组数据库(如50万规模的UK Biobank),我们也许能从理论上规避这两个问题,构建教育水平的多基因分数。
1700229843
1700229844
即便我们可以为每个群体算出一个多基因分数的值,欧洲后裔和美国黑人的结果也是风马牛不相及。这些结果或许能帮助我们理解种族内教育分层的现象,但是对跨种族研究毫无意义。这是因为,只要试图比较两个各自独立计算出的数据,“筷子问题”就会存在:对两个群体间的所有可见差异,我们都应该将主成分提取出来,以排除群体间潜在的环境差异影响。
1700229845
1700229846
另一种可以用的方法——直接追溯先祖,然后评估其效应——也有严重的不足。乍听上去,这个方法是可行的。我们已经知道,每个大洲的“生态群”(cotinental clines),或者叫“种族”有着不同的遗传性状。值得注意的是,差异的主成分与选取群体高度相关(如欧洲最主要的两个地理主成分是东西和南北)。27主成分分析(PCA)是统计学上的一种手段,可以给出在单个维度中造成最大变化的那个变量。在有基因数据的情况下,第一主成分(PC1)可以有效把握SNP中跨基因组相关的性状,并由此可靠地追溯祖先。第二主成分(PC2)描述的是去掉第一主成分之后对差异造成最大影响的因素,或者叫维度。28如果我们知道你在这两个维度上的得分,我们就可以对你的种族和起源做出有效(但不可能完全确定)的估计。增加额外的主成分可以提高预测的准确性,我们甚至可以在同一个种族内再进行分类,采用其他的方式也能得到相似的结果。
1700229847
1700229848
在遗传学研究中,这些主成分常被用于划分人群(血统)结构,以避免前文提到的“筷子问题”,这个问题导致在确定结果的根源时,环境、文化、历史差异会与遗传差异相混淆。如我们在第三章中所描述的,在GWAS研究中,研究者试图利用回归估计手段,从统计上将单个单核苷酸多态性与表型建立起联系。为此,研究者通常需要10个以上的主成分,以确保被试者基因组中余下的部分基本一致。主成分的另一个作用是跨时跨地比较不同人群的基因组,以追踪其混合模式与历史迁移模式。29
1700229849
1700229850
然而,新兴的第三种主成分使用方式则存有争议,即不仅把它用作控制变量,还作为主要研究对象;也就是说,用“祖先”的主成分来直接研究社会经济中的差异。这样的研究有一个方法论上的优势:虽然种族分类是离散的,而且基本采用降格继嗣原则,但血统成分却构成了一个连续的谱系。人为定义的离散种族类型——黑人、白人、拉丁裔、亚裔、印第安人、其他,不仅涵盖的基因型范围很大,而且混合方式也多种多样,尤其是在美国这样的移民国家中。在黑人群体中非洲、欧洲血统各占一定的比例(也有一定的印第安人血统,但比例较小)。事实上,所有自称是黑人的美国人中,欧洲血统平均占到了10%。30
1700229851
1700229852
虽然用主成分分析来研究祖先情况是有先例的,但我们还是应该十分谨慎。31我们需要在这方面深入研究的原因有如下两个。第一,对于遗传学和社会科学交叉学科的研究者来说,它指出从种族分类转向大洲祖先研究的一个清晰方向(与医学和生物学的相关进展类似)。第二,我们相信自己可以开启对这一思路中存在的问题的阐述,帮助后人避免过往研究中的滥用和误用。
1700229853
1700229854
主成分分析无法告诉我们到底是哪些基因影响着智力,然而它可以告诉我们的是,非洲血统的比例(或者欧洲血统的比例)与智商和教育水平等表型有无关系。我们不关心哪个基因决定认知能力,而是去研究一个有20%欧洲血统的美国黑人和一个有4%欧洲血统的美国黑人在认知测试中的表现(我们也可以在白人群体中做这样的研究,但白人中的非洲血统比例少得可怜)。
1700229855
1700229856
这种方法的主要困境是:因为我们研究的变量是主成分,“筷子问题”依然存在,即我们如何确定是祖先的基因标记,而不是与之相关的历史、地理因素决定了其智力水平?比如,美国最南部各州依然是美国黑人最集中的地区,而密西西比州则是黑人比例最高的州。而且,密西西比州与最南部各州也是美国学校最糟糕的区域之一,黑人学校、白人学校都一样。所以,我们也许应该专门研究“位于密西西比州”这一变量的影响(假设与美国其他地方相比,这里的非裔具有更多的非洲血统)。事实上,最近的一篇文章显示,美国黑人中含有的欧洲血统比例和向西、向北的迁徙存在关联——在美国西部和北部,黑人所处的社会环境更好。32或许我们应该考虑家庭背景的因素,因为欧洲血统较多通常意味着家庭环境较好。不论我们考虑并试图排除多少因素,主成分中总是会存在一些无法观察到的环境因素。
1700229857
[
上一页 ]
[ :1.700229808e+09 ]
[
下一页 ]