打字猴:1.700229561e+09

1700229561

1700229562 话虽如此，但正如我们有理由怀疑基因互作是遗传力缺失的罪魁祸首一样，相反的理由同样存在。如果基因间的相互作用影响如此之大，那么杂合了父母双方基因的兄弟姐妹可能就不会像他们实际上那样相似了。再考虑两个多巴胺受体基因的情况。兄弟姐妹之间有1/2的概率共享等位基因1，也有1/2的概率共享等位基因2，所以兄弟姐妹之间拥有完全相同基因的概率仅为1/4。25以此类推，到了3基因或4基因的情况时，兄弟姐妹之间就会像陌生人一样没什么相似之处了。但这与我们实际观察到的现象不同。观察亲缘关系很近的个体之间的表型时，我们会发现，个体间的相似程度会随着亲缘关系接近而呈线性增长。从堂兄弟到表兄弟再到双生子，相似程度在不断增加。这就表明，我们正在寻找的能够与分子生物学研究相对应的“加性”遗传力确实反映出了可加性，而基因互作并没有发挥任何重要作用。

1700229563

1700229564 此外，已经有数学方法证明，在进化过程中，为何起作用的更可能是加性变异而非相互作用。我们可以想象一下，如果每个基因的效果都要取决于10个其他基因，进化该会是多么复杂而低效啊！这意味着，任何一点进步都需要许多基因同时改变才可以实现。想想多巴胺受体基因的那个例子，假设有一种能够带来优势的DRD2基因变体，但只有在DRD4为某种特定的等位基因时，优势才能体现出来，否则就会无效。于是，只有这两个基因都发生有利变异时，生物才会发生相应的进化。由于突变是随机发生的，上述情况的概率对于个体来说实在是微乎其微。

1700229565

1700229566 因此，基因互作不太可能是造成表型遗传差异的主要原因。如果任何基因的效应都高度取决于其他基因，那我们就像被基因连成的蜘蛛网困住了，动弹不得。要想实现进化，只能寄希望于1000只猴子都在同一时间敲下正确的按键；或者这1000只猴子中有1只天赋异禀、卓尔不群，在环境剧烈变化时存活下来，独自担起物种进化的大任；或者它能够通过新的方式利用环境资源，比如，创造石器，学会用火，最终甚至发明了互联网……总之，结论就是，也许一些基因互作对某些结果至关重要（而且在论证基因与环境的相互作用时，也必须排除基因互作），但它们不太可能是遗传力缺失的主要原因。26

1700229567

1700229568 对遗传力缺失的另一个解释是：可能达尔文是错误的，而让-巴蒂斯特·拉马克（Jean-Baptiste Lamarck）才是对的。换言之，也许环境引起的改变其实是能遗传给后代的。拉马克曾经指出，长颈鹿之所以脖子长是因为经常使劲伸脖子，而且能一代代传下去，每一代都比前一代更长。拉马克因为这个假说受尽嘲笑。27达尔文公开否定了获得性遗传的假设。他的主张是，基因的随机突变和生存竞争引起了表型的改变，使生物形态多样化，进而演变出了生态位（ecological niches）中各种各样的生命。然而，近年来随着表观遗传学（epigentics）的迅速发展，拉马克的获得性遗传理念正卷土重来。具体来说，我们除了有DNA密码之外，还有表观遗传的密码，这个密码使细胞能够根据不同的组织、不同的时间、不同的环境或刺激来决定是允许还是禁止一个基因的表达。一直以来，人们认为每一代人体内的表观基因组（epigenome）在下一代人身上都会清零，一切从头开始，这样单个细胞才能分裂、分化，成长为完整的人。然而，现在有些科学家认为，表观遗传标记（epigenetic manks）也许是可遗传的。果真如此的话，通常的分子层面检测方法（只关注碱基对，而不考虑表观遗传标记）可能会忽略这种重要的遗传形式，从而导致遗传力缺失。但是，我们现在几乎没有证据表明，人类真的能将环境导致的表观遗传标记遗传给下一代。即使果真如此，这种标记也不太可能在第二章提到的双生子模型中导致如此高的遗传力。我们在附录4中讨论了几个可能与遗传力缺失有关的最新表观遗传学进展，但我们最后得出的结论是——表观遗传学并不是遗传力缺失的原因。

1700229569

1700229570 基因：不平等的遗传 [:1700229225]

1700229571 遗传力缺口处的碎片：需要时间去推敲的计算法则

1700229572

1700229573 与此同时，对于遗传力缺失还有一种简单得多的解释——效果不明显，样本也太小。我们可以把一个遗传学研究的样本量想象成照片的像素，像素低时，我们也能明显地辨别出大致的性状，比如，照片里是有山还是有海，天空是蓝色还是绯红色。像素（样本量）越高，我们能辨别的细节就越精确，越能看出照片之间的细微差别。这就是遗传学所谓的“微小效应”范式转向。

1700229574

1700229575 社会科学家感兴趣的大多数效应都受到很多基因的影响，而社会科学研究惯用的样本量（一般不超过1000~10000个研究对象）很难识别出这些基因的各种微小效应。这就相当于照片像素太低，图片太模糊，导致我们看不清想找的东西。即使用身高这种我们确信高度可遗传的性状来说，当我们把样本量增加10倍（比如，从20000个增加到200000个）时，GWAS中的显著位点数量也相应增加了一个数量级，从10多个增加到了100多个。

1700229576

1700229577 但是，样本量只是其中的一个问题。当我们有具体搜寻目标的时候，为了避免由于之前谈到的各种原因导致的假阳性现象，我们最好将范围限制在达到全基因组显著水平（5×10－8）的位点上。但是，当我们想要解释总体差异情况时，这个方法就不合适了。在如此严格的标准下，我们势必会把大量有用的信息排除在外，因此有可能犯下假阴性的错误。这条原则有点像刑法学里的一条经典原则（有时称为“布莱克斯通公式”）：哪怕放走10个罪犯，也好于让1个无辜者入狱。这固然是个合理的原则，但会导致很多刑事案件无法结案。放到这里，就是会忽略许多遗传效应。

1700229578

1700229579 为了避免遗漏重要信息，我们可以采取一种替代方案，即综合我们收集到的所有信息。这并不困难，只需要把GWAS的数据加总即可。以1号染色体上的1号SNP为例，如果我们发现，相关等位基因每增加一个，智商就会提高0.1点，那么如果我们分别给没有该等位基因、有一个和有两个的情况赋予0分、0.1分和0.2分。然后再算1号染色体上的2号SNP，直到把23条染色体上所有的SNP都算完。通过这种方式，我们就能把整个基因组扫描一遍，然后用我们上百万的独立GWAS计算出一个多基因的分数。这个公式是通过对一个（或多个）样本进行GWAS得出的，接下来我们将这个公式套用到另一个独立的样本上，用它来进行预测，看看它能在多大程度上解释表型的变化（也就是它得出的遗传力在多大程度上是可加的）。

1700229580

1700229581 实际上，在关注全基因组内的显著位点的情况下，我们的教育的多基因分数（polygenic score）几乎完全无法解释教育年限、智力水平的差异。然而随着我们逐步放宽要求，直到最后考察全部的SNP时，我们发现预测能力也在稳步上升。但我们仍然只能解释教育方面3%左右的差异，而我们本来以为它的遗传力至少应该是这个数字的10倍。一个最近的评分研究表明，它能够解释大约6%的教育年限差别，同时科学家也在致力于增加样本容量，以进一步提升预测能力。28

1700229582

1700229583 在身高的遗传分析方面，科研工作者已经能够通过一项分数来解释60%的遗传力了，这项分数是由GWAS数据加总得来的。想想看，只要用一个数字！29随着“元分析”（metaanalysis）（一种将多个样本的结果整合起来的统计学手段）可用的样本越来越多，也越来越大，这个数据也必然会上升。30图3.3基于单个研究的样本量显示了一些预测（大量研究使这个斜率稍微平坦了一点，但总体趋势是相同的）。31

1700229584

1700229585 若想将完整的加性遗传力估计归约为可以通过个体基因分型SNP芯片确定的单一分数，目前面临着重重障碍。而障碍之一就是，我们测得的SNP标记并不能完整地反映基因组中真正关键的SNP。32遗传力会因时间和地点而异的假设带来了第二个障碍。在研究环境和人群相差巨大的情况下，如果仅仅去寻找共有的遗传效应，那么得到的结果可能不过是某个特定样本中某个性状的遗传力的一部分罢了。

1700229586

1700229587

1700229588

1700229589

1700229590 图3.3 样本量与某多基因分数能够解释的遗传力比例的关系

1700229591

1700229592 资料来源：Daetwyler et al.（2008）

1700229593

1700229594 注：该分数衡量的是一个连续性状，基于SNP计算得到的遗传力为12%。由样本量的PGS条件解释的遗传比例随着遗传力而上升（h2snp）。图中Y轴（纵轴）代表着这个案例中的表型变异比例，最大值为12%；X轴（横轴）描述了需要12%的预测值所需的样本量，范围是0~3000000。

1700229595

1700229596 暂时把这些问题放在一边，概而言之：并没有遗传力缺失这一回事。它隐匿于人类种群中常见的各个个体中，我们只是需要大量样本来提高实验的信噪比（signal-to-noise ratio）。这些大样本如今可以通过网络获得。私营基因组公司23andme如今已经为超过100万人进行过基因组测序（尽管这些对象有高度的自我选择意识，但代表性不是很强）。加利福尼亚的Kaiser Permanente也为超过50万名受试者进行过基因测序。33The UK Biobank提供了50万名受试者的基因型信息，他们的受试者是通过合理的采样方式抽取的，以保证各民族样本的代表性，虽然也面临着参与率低下的隐忧。

1700229597

1700229598 当我们对于这些单一多基因评分的预测能力开始达到两位数时，就有必要对人为选择［或称“私人优生”（personal eugenics）］进行严肃的讨论了。尤其是当越来越多的父母选择试管婴儿的生育方式时，这样的讨论就显得更为必要（关于政策的影响，我们将于第八章进行讨论）。同时，在我们能够直接测量给定基因型的效应，而不仅揣测相关性的情况下，这些分数已经对解释许多问题提供了帮助，比如，基因是如何与社会环境相互作用的（第七章的主题），以及我们会如何将自己分成不同的“遗传种姓”（genetic caste），或者避免这一情况的发生。

1700229599

1700229600 在这种情况下，教育的多基因分数让我们能够从简单的遗传力计算以外的角度去重新审视基因统治（genotocracy）问题。遗传力描述的是遗传因素对于某个性状的影响程度，但它无法告诉我们遗传影响在家庭内部以及不同家庭之间的情况。但有了多基因分数之后，我们就可以做到这一点了。假如家庭之间（相当于人群中随机选择的个体间）的教育分数有较强的预测能力，而家庭内部的分数（即解释兄弟姐妹的成绩差异时）则价值不大，那么《钟形曲线：美国社会中的智力与阶层结构》的观点，即遗传会促进正在扩大的社会阶级分化和代际复制，似乎就是有一定道理了。

1700229601

1700229602 我们现在来看另一种情况：与从总体中随机选定的两人相比，多基因分数相差一个标准差带来的实际成绩差别对一对兄弟（或姐妹）更大。在这种家庭内部差异较大的情况下，遗传因素可能会不利于“老子英雄儿好汉，老子狗熊儿浑蛋”的发生，而有利于个人的成功。尽管随机婚配（random mating）会使兄弟姐妹间的相关性平均约为50%，这种假说依然是可能的。换言之，在基因、生态位构成（niche formation）、特化（specialization）等因素作用下，家庭内部共有的遗传基因（geneticsand）可能会被抵消，带来净的社会流动性。

1700229603

1700229604 我们会发现，给定教育多基因分数的差值，相对于从总体中随机选取的两个人，兄弟姐妹间的实际成绩差异确实更大。34换句话说，尽管兄弟姐妹共有的基因较多，他们之间的差异依然十分关键。在家庭内部，一个标准差的分数差值会引起约1/3的教育年限差别；而如果是两个随机个体，这一数字大约是1/4。为什么会出现这种结果呢？答案很可能在于微小差异带来的巨大外部影响。人们会更多地在兄弟姐妹之间进行比较，而并不是将他们与随机选取的人比较。父母看到兄弟姐妹间的能力差异后，可能会进一步强化这种差异，孩子自己也可能会去想办法与兄弟姐妹区分开，从而放大了基因差异的效果。比方说，一个家庭里有两个孩子，一个喜欢学习，另一个更喜欢运动。前者可能会通过拼成绩来确立自己的个性，而后者则会更重视在校队里的表现。不论原理如何，这都会减轻基因型对阶级固化的推动作用（虽然并没有完全消除，因为虽然家庭内部的效应较强，但还没有强到完全抹杀兄弟姐妹共有基因影响的地步）。这个故事比赫恩斯坦与默里的更加复杂。兄弟姐妹间的微小差异和共同遗传来源对不平等代际延续的影响方式还取决于另一个因素：父母根据基因差异对孩子区别对待的程度。这也正是接下来的话题——基因分类。

1700229605

1700229606

1700229607

1700229608

1700229609

1700229610

[ 上一页 ] [ :1.700229561e+09 ] [ 下一页 ]