打字猴:1.7002298e+09
1700229800 在大约40万年的时间中,这些早期猿人(non–Homo sapiens)独自占有着欧亚大洲(仅考虑人的话)。但是在100万年前,一群智人(Homo sapiens)离开非洲,扩散到世界各地(也有学者认为这样的迁徙有多次)。有证据表明,这场迁徙中的有效群体大小(也就是可以交配的人数)为1000~2000人。很难说究竟是只有这2000人富有冒险精神,还是他们只是一个庞大出征队伍的幸存者。无论如何,关键事实是这2000人成为非洲外所有人的共同祖先。11
1700229801
1700229802 迁徙中的“人口瓶颈”导致现代社会中非裔和其他人之间巨大的遗传差异。当群体的有效交配人口数目过小时,很多遗传差异会消失。进化中性理论认为:在没有选择压力的情况下,基因标记的消失是随机的。12如果一个群体很大,那么一个给定的基因标记几乎不可能在某一代随机消失。而如果这个群体很小,这件事情就更有可能发生。比如一个占比10%的SNP。如果人群中的交配群体有10个人,且只有一个人有这种SNP,那这种SNP只有两份。很有可能,在某一代中这两份都没有传给子女。特别地,其概率是1/4。然而在一个200人的群体中,20份拷贝都没有传下去的概率陡降至一百万分之一。因此,最早离开非洲的一小群人只包含整个群体中的一部分基因信息,而且很容易丢失。随着人们离开非洲越来越远,这两种效应使人群中的基因多样性越来越少。事实上,在人类逐渐遍布地球的过程中,迁徙最远的一群人中的多样性下降最明显。这就好像在面包片上抹果酱的过程,随着刀锋在面包片表面滑行,抹上去的果酱越来越少,最后可能只有薄薄的一层。类似地,距离东非的距离也可以很好地表征一个族群基因多样性的大小。
1700229803
1700229804 量化基因多样性的指标有很多,最简单的是杂合子的比例(一个人两条染色体上等位基因不同的频率)。在假设随机婚配的情况下,如果某个位点的两种等位基因在人群中是平均分布的,那么此时的杂合子率是比较高的,约50%13,但是如果某一种的出现率减小到0,这个位点是杂合子的概率也会减小到0。另一种检验基因多样性的指标是考察在DNA中一段给定的序列连续重复的次数。例如,对AGGTCT在一行中进行重复计数。这是所谓的拷贝数变异。
1700229805
1700229806 根据研究我们可以看到,除了某些特例,非洲群体有极高的基因多样性,而美洲原住民和太平洋岛民多样性较低,这和我们之前的预测——他们与东非的距离——是一致的。14有些部落,包括“北卡”和“匹兹堡”,具有很高的基因差异性。尽管受到黑奴贸易中潜在建立者效应(founder effect)的影响,也经历了与欧洲人和印第安人的通婚,但是这些美国黑人仍旧保持了很高的基因多样性。这些非裔巨大的基因跨度(与百万年前徒步离开的人相比)印证了之前的论断——基因多样性高低的分界线由是否来自非洲决定的。15综上所述,我们现在用的种族分类来自一段混乱而血腥的历史,其中不乏对事实的故意扭曲。即便5个种族的分类法是合理的,这5个种族也并不能和遗传分析的结果保持一致,尤其是在我们可以精确量化这些差异之后。16
1700229807
1700229808 基因:不平等的遗传 [:1700229233]
1700229809 祖先差异是重要因素还是随机误差
1700229810
1700229811 人种论在科学的角度是站不住脚的。然而,大洲祖先的差异是有遗传学根据的。但是大洲间的遗传差异对当代社会又有什么意义呢?现在,我们有必要打破一些左右两派同样在大肆宣扬的对基因差异的神话了。“左派”的许多人倾向于忽略人种之间的基因差异,指出这些人种内的基因差异大于人种间的差异。他们经常引用的事实是,所有人类的基因组有99.9%是一样的,并没有哪个族群含有其他族群没有的基因(比如,编码蛋白的基因)。这些说法都是错的。毕竟,我们和大猩猩的基因相似度也高达98%,与尼安德特人的基因相似度也有99.7%。这2%(或0.3%)的差异是多么微不足道啊!
1700229812
1700229813 简单来说,与其谈总体差异,不如具体基因具体分析。想象一群FOXP2基因(所谓的语言基因)发生了变异的人,他们体内的转录因子(transcription factor)是失效的。这些人没有用语言交流的能力。事实上,这个基因的功能被首次发现是在研究一个患遗传病的英国家族时,这个家族三代人中有一半患有严重的言语运动障碍(verbal dyspraxia)。这个家族和邻居有99.9999%的遗传相似性,但就是那0.00001%的差异产生了巨大的影响。虽然整体高度相似,但局部差异还是会产生巨大的影响,这种效应存在于各种生物中。通过在实验室里人工修改4个基因,科学家可以让拟南芥(一种草本植物,株高20厘米左右)长成高大的乔木。就好像是娱乐节目《听声识曲》(Name that Show)的遗传学版本,只需要几个基因就可以彻底改变生物的表型(虽然像SNP这类常见的变异在人群中的影响较小,但是某些基因的改变或失效会对表型造成重大影响。即便是由多个基因控制的表型,比如侏儒症或者智力障碍)。
1700229814
1700229815 过分强调所有的人类拥有同样的基因型(即使他们的表型不同)会忽视这样一个事实:生物学意义上的进化并非只体现在基因的增减上,而更多地体现在对基因表达的调节上——对产物、时机、位置,甚至表达与否的调节。在人类基因组计划(HGP)启动时,对人类总基因数的预计为10万个左右。毕竟,我们比只有32000个基因的玉米高等多了。17测序的结果让人大跌眼镜,人类的总基因数只有不足2万个。所以说,绝大多数人类的差异来自这2万个基因在体内的具体调节。同一个基因可能在大脑中表达,也可能在肝脏中。某些基因只有在受到细菌侵袭时才会被激活,而一碗热面条又会关闭这个基因。每个基因就像是一个努力工作的家长,白天在单位忙前忙后,下班之后匆匆回家做饭,还要火急火燎地去开家长会。
1700229816
1700229817 人类有2万个基因这一事实并没有排除另一种可能——表型的差异来自基因组调控区变异(如启动子、增强子、小RNA和其他分子开关)。相比研究人们是否拥有同样的蛋白,更有意义的是研究等位基因是否一致。在考察了某个族群是否拥有其他族群没有的等位基因后,我们得出的结论是肯定的。非洲人拥有最多的特有等位基因,这也是该地区巨大基因多样性的体现。问题在于,没有证据可以排除这些特有等位基因在群体差异中的影响。
1700229818
1700229819 “左派”的第三个观点是:从进化的角度,人类发展的时间还太短,不足以让有明显效果的差异出现。史蒂芬·杰伊·古尔德(Stephen J.Gould)有一句名言:四万年来,人类没有发生任何生物学上的变化,所有的文明都是用同样的头脑和躯体建造的18。根据此种说法,人类进化史在现代人从东非起源之后就结束了。毕竟和原始人漫长的历史相比,6万年的时间不过是弹指一挥。如果我们要分析其他大洲人类的差异,时间尺度就更小了。然而,族群间的差异既有可能从对原始突变的选择中产生,也有可能从一些多基因决定的性状中产生,因为其中已经积累了很多可供选择的变异。我们已经知道,身高和认知能力具有很强的多基因性,数以千计的小小差异都影响着最终的结果。如果群体中的高智商者生育率更高,可以预见几代之后群体的平均智商水平就会有质的飞跃(假定高智商带来的生存优势足够强)。19从这个角度来看,6万年似乎已经是地老天荒了。20只要不同的表现——不只是智力,还有勇气、自律等——会带来不同的生存能力,可以想见遗传性差异很快就会发生,不过需要几千年。21
1700229820
1700229821 事实上,这正是某些有争议的学者所推崇的理论。比如,人类学家格雷戈里·科克兰(Gregory Cochran)和已故的亨利·哈本汀(Henry Harpending)在他们的著作《一万年爆发》(The 10000 Year Explosion)中指出的,新石器革命(Neolithic Revolution)和定居文明的开始使社会结构,而不是自然环境,成为群体遗传性改变的主要动力。结果就是,当今的很多差异都可以追溯到农耕时代起日益增长的选择压力。这样的压力使擅长规划的人比强壮的狩猎者更具优势。在给定的一个社会中,成熟农业兴起的时间是与族群适应新生活方式的程度密切相关的。他们的理论虽然能自圆其说,但是没有经过数据的检验,仅仅依赖一些偶然的证据。尽管最近的研究显示,技术的发展并没有让进化停滞,但我们并不知道现代社会中自然选择的驱动力是什么,以及它会带来哪些影响。22换句话说,虽然人类还在进化,在自然选择的压力下不断分化,但是自然选择在各个大洲上仍然是相同的,不受社会等方面的影响。
1700229822
1700229823 在人类进化以及群体差异的领域内,“左派”的观点只占了半壁江山。“右派”也有自己的一套神话。比如,尼古拉斯·韦德(Nicholas Wade)是《天生的烦恼》(A Troublesome Inheritance)的作者,他关注分布呈现地理差异的那些基因位点,试图以此来解释群体间的差异。诚然,有一些基因,如FOXP2,存在他们所说的那种强力效果,但他们恰恰错在不是每个基因都是这样的。例如,韦德经常举的例子是MAO-A基因拷贝数的差异,他认为这是一个“战士基因”。理由是经过对一些志愿者的基因分析发现,这个基因的存在会增加暴力倾向。然后他们说这个“暴力基因”在黑人中出现的频率更高。然而,正如我们在第三章中阐述的,这样的候选基因实验——尤其是韦德用的这个——经不起重复测试的考验。即便通过了,这样的分析也只能说明群体差异中的一些细枝末节,并不能以此证明种族间存在不同的基因模式。
1700229824
1700229825 “右派”的另一个错误是过分相信自然选择而忽视了遗传漂变。23在自然选择中,不同的基因会使个体具有不同的存活率,从而逐步影响群体的基因型。
1700229826
1700229827 而在基因漂变中,遗传变异是随机产生的,与生存优势关系不大。这一过程会为不同地区、不同时期的族群(像是美国白人和美国黑人)打上不同的“标记”。不同族群间的表型——比如,身高或智商也可能出现差异,但那是由和遗传差异密切相关的环境因素导致的。
1700229828
1700229829 随着环境的变化,纯化选择正在发生。一个非常明显的例子是镰刀型红细胞。具有镰刀型红细胞的个体有抵御疟疾的能力。控制这一性状的基因只分布在非洲中西部的部分地区。而非洲中西部恰恰是疟疾发病率最高的地区之一(其他疟疾高发区发展出了其他抵抗疟疾的基因,如G6PD)。另一个例子是体形的大小。根据阿伦定律(Allen’s Rule),热带地区的恒温动物耳朵和四肢较大,以利于散热;寒冷地区则恰恰相反。这一效应在人类和其他恒温动物身上都有所体现。
1700229830
1700229831 因为我们在身体结构上发现了环境和基因的影响,所以有些人认为,人类行为和心智也可以这样简单地去分析,这是许多基因决定论者犯的另一个错误。他们犯了效度的错误,盲目推广小样本下的结论是无效的。在一些由少数基因决定的性状中,我们可以清楚地看到基因型与自然选择的关系,如肤色、瞳色和乳糖耐受等。但是像认知能力这样由众多基因控制的性状,这一关系就不那么明显了。在我们研究体形的时候,四肢长度的变化和阿伦定律预测的基本一致,但是与身高不同,四肢长度这一性状只由少数几个基因控制(主要由HOX家族基因控制)。24实际上,身高并不符合纬度分布的规律。除了行为表现的多基因型和复杂性,用遗传学来解释种族兴衰的理论并不可信。1000年时光足以让人群中的遗传差异充分表达,但200年或许就不够了,50年的可能性就更小了。25因此,要想解释生活水平和社会形态的差异,我们需要比遗传差异更有解释力的理论,可能是制度差异,也可能是法律差异,等等(我们会在第六章继续讨论)。目前的研究认为,遗传差异虽然也是国家、种族和民族间经济与社会差异的一个可能解释,但可靠程度很低,而且难以证实。接下来,我们就要看看到底有多大难度。
1700229832
1700229833 基因:不平等的遗传 [:1700229234]
1700229834 各大洲祖先是真的,说明了什么?
1700229835
1700229836 我们现在知道的是,各大洲人类的祖先有很大的遗传差异(这些差异和种族分类相关,但多数时候是相反的)。我们现在试图回答一个更加具有争议性的问题:当代美国种族间各项指标的差异可否用祖先间的差异来解释呢?有没有一些基因型差异凌驾于环境差异之上,直接导致了教育水平和收入水平的差异(关于环境因素的部分请参阅附录5)。我们已知,不同祖先的人群间有很多基因的频率不同,但是有证据表明,这些不同并没有给智商等指标带来显著的影响。但是是否存在这样一种可能:在黑人与白人之间的这些小小的差异累加起来,就形成了足以影响智商的结果呢?我们又该怎样观测这样的变化呢?
1700229837
1700229838 这是一个“令人不愉快的”,总是被意识形态左右的问题。作为科学家,我们有充分的理由绕开这个问题。换句话说,这些研究带来的破坏性比它们的价值更高。26现在我们提出这个问题,就是希望以一种科学的而非意识形态的角度来看待它。虽然把研究限制在某一个种族内会更简便易行,但如果我们的书中只涉及社会遗传学,而非它和种族的关系,那显然是在逃避问题。在围绕美国论述种族/大洲起源的一章中,如果我们不谈基因在解释社会经济结果方面的潜在作用,也不免有隐瞒事实之嫌。此外,略过这些内容显然会背离本书的主旨:负责任地将遗传学与社会科学结合起来。最后即最重要的是,随着遗传学和社会科学交叉研究的大发展,终有一天会有人去研究种族、基因和社会成就间的关系,与其等着一帮种族主义学者借题发挥,还不如我们现在就向公众揭示到底什么样的假设是合理的,什么样的数据又是科学的。
1700229839
1700229840 一个很容易想到的处理方式是,直接比较白人和黑人基因组中的微小差异,看他们是否具有“加性”,以及“加和”之后,这些遗传差异是否能够解释重要的表型差异,比如,教育水平。这里有至少两种进行“加和”的方式:第一种读者应该比较熟悉,就是多基因分数;第二种则会在后面详细介绍,即主成分法(principal components)。
1700229841
1700229842 如果我们在黑人和白人间比较教育水平的多基因分数,能通过结果来说明就学儿童的差异是由基因决定的吗?进行这一比较要面对许多困难,有些是技术上的,有些是概念上的。让我们先来看技术问题,因为这个似乎更好解决。首先,计算多基因分数需要所有(至少绝大部分)欧洲先祖的基因样本,由此引发的关于数据有效性和缺失问题不容忽视。由于计算多基因分数时采集的环境数据不包含黑人的生活环境和教育环境,可想而知,多基因分数在黑人群体中的预测表现会大打折扣。数据缺失问题的产生则是由于黑人群体有很多“特有基因”。而欧洲人的祖先并没有这些基因,因此,多基因分数在这一方面无能为力(一个相关的问题是剪裁基因数据,详见附录6)。如果我们有一个大型的非洲人全基因组数据库(如50万规模的UK Biobank),我们也许能从理论上规避这两个问题,构建教育水平的多基因分数。
1700229843
1700229844 即便我们可以为每个群体算出一个多基因分数的值,欧洲后裔和美国黑人的结果也是风马牛不相及。这些结果或许能帮助我们理解种族内教育分层的现象,但是对跨种族研究毫无意义。这是因为,只要试图比较两个各自独立计算出的数据,“筷子问题”就会存在:对两个群体间的所有可见差异,我们都应该将主成分提取出来,以排除群体间潜在的环境差异影响。
1700229845
1700229846 另一种可以用的方法——直接追溯先祖,然后评估其效应——也有严重的不足。乍听上去,这个方法是可行的。我们已经知道,每个大洲的“生态群”(cotinental clines),或者叫“种族”有着不同的遗传性状。值得注意的是,差异的主成分与选取群体高度相关(如欧洲最主要的两个地理主成分是东西和南北)。27主成分分析(PCA)是统计学上的一种手段,可以给出在单个维度中造成最大变化的那个变量。在有基因数据的情况下,第一主成分(PC1)可以有效把握SNP中跨基因组相关的性状,并由此可靠地追溯祖先。第二主成分(PC2)描述的是去掉第一主成分之后对差异造成最大影响的因素,或者叫维度。28如果我们知道你在这两个维度上的得分,我们就可以对你的种族和起源做出有效(但不可能完全确定)的估计。增加额外的主成分可以提高预测的准确性,我们甚至可以在同一个种族内再进行分类,采用其他的方式也能得到相似的结果。
1700229847
1700229848 在遗传学研究中,这些主成分常被用于划分人群(血统)结构,以避免前文提到的“筷子问题”,这个问题导致在确定结果的根源时,环境、文化、历史差异会与遗传差异相混淆。如我们在第三章中所描述的,在GWAS研究中,研究者试图利用回归估计手段,从统计上将单个单核苷酸多态性与表型建立起联系。为此,研究者通常需要10个以上的主成分,以确保被试者基因组中余下的部分基本一致。主成分的另一个作用是跨时跨地比较不同人群的基因组,以追踪其混合模式与历史迁移模式。29
1700229849
[ 上一页 ]  [ :1.7002298e+09 ]  [ 下一页 ]