打字猴:1.70023038e+09
1700230380 基因:不平等的遗传 [:1700229256]
1700230381 基因:不平等的遗传 附录2 降低遗传力估算值的另一种尝试: 采用全基因组复杂性状分析与主成分分析方法
1700230382
1700230383 在GCTA或GREML(全基因组复杂性状分析)中,1为了确保遗传力分析是在没有血缘关系的个体间进行的,科学家排除了两类人:如果两个人有明显的血缘关系,他们会被排除;而如果两个人的前几位主成分高度相似,他们也会被排除。这样的话,任何体现在测试数据中的相似性都是随机的。由此,我们就能确认环境差异并不会对观察到的遗传差异造成影响。值得一提的是,由基因差异引发环境差异,术语叫作“内表型”(endophenotype),只是基因借以发挥作用的多种方式之一。
1700230384
1700230385 但是,会不会依然存在某些造成混淆的环境差异呢?我们观察了一些个体无法改变的环境变量,比如,是在城市还是乡村,或是父母的教育水平。然而结论是这些因素本身就是可遗传的。有些人说自己喜欢住在乡村可能就是因为遗传。另外,由于子女和父母各拥有一半相同的基因组,我们或许仅仅是在父母的居住偏好中寻找遗传上的影响。但是这种影响很弱,因为在传代的过程中遗传信号会被稀释。但是,因为我们想要研究的是兄弟姐妹之间的差异,所以应该再稀释一次:在假设随机交配的情况下,实际值只有(通过测量父母基因组得到的)预测值的1/4左右。2事实上,在城市/乡村的选择上,我们发现了30%的遗传力。如果提取的主成分数量从5个增加到25个,这一概率会降低至15%。从15%的下限可以推导出,对父亲来说,这一性状的遗传力高达60%以上。这个数字是令人难以信服的(60%的比率已经接近一些生理性状了,如身高或者体重,这些性状的遗传力在80%左右)。对母亲教育程度的研究得到了相似而且同样不可信的结果。因此,我们认为,或许是GCTA这一方法本身有问题。也许环境潜藏在遗传信息中,正如我们在双生子模型中分析的一样。
1700230386
1700230387 《自然–遗传学》副刊的一篇研究证实了这一推测。该文以精神分裂症为指标。3在此之前,他们还做过一次稳健性检验,但这一次他们做得更精明:每次只看一条染色体。如果影响实验结论的只有基因重组而非环境,那么两个人在某一条染色体上的遗传相关性应该和另一条染色体上的相关性无关。比如,在4号染色体上的相关性应该和他们两人在12号染色体上的相关性毫无关系。这是因为我们基因组中的23张牌并不是一整副,而是有23套独立的牌组,基因组是它们的累加。所以,某一条染色体的重组情况是与其他染色体独立的,除非存在群体分层或祖先相同等情况使某人群内部的相似度较高。换句话说,如果遗传相关性在一定程度上受(祖先导致的)人群结构影响,我们应该能从染色体之间的关联中看出来。具体地讲,在8号染色体上更相近的两个人在4号染色体上也会显示出更多的相似性,其他染色体亦然。除此之外,没有其他方法能解释这种跨染色体的相关性。让我们再用洗牌举例:上面提到的相似性并不是因为洗牌时的运气,而是因为不同的牌出现在牌堆的概率不同。
1700230388
1700230389 该文的作者在补充材料中给出了上述测试的结果。有一些染色体确实和其他染色体相关联,尽管理论上并非如此。当然,这也可能只是随机误差。作者并没有进行统计上的计算,来证明观察到的现象是否代表着染色体相关性的整体移动。
1700230390
1700230391
1700230392
1700230393
1700230394 图A2.1 个体间的染色体相关度
1700230395
1700230396 注:如果真的只是由于染色体随机重组导致一些个体之间有更高的遗传相关性,那么染色体之间应该不存在相关性,因为它们都是各自分离的。然而,观测到的结果是个体间的染色体相关度在概率分布图中向左偏移,这表明染色体倾向于依相关度聚集。这一发现暗示人群结构(即族裔)是整体相关性分布的部分驱动因素,进而表明环境差异可能干扰遗传力估算。
1700230397
1700230398 图A2.1是一个简单的条形图,表明相关性很高。如果这真的是由随机误差导致的,那么应该只有10%左右的点落在p< 0.1的地方。相反,我们看到右侧的点显然更多。统计学计算表明,随机分布呈现出这种形状的概率不到千万分之一。所以作者的核心假设,即遗传相似性是由随机重组而非群体层面的差异导致的,成立的可能性只有千万分之一。4
1700230399
1700230400 为了避免在双生子分析中造成失败,我们重新计算了一大批性状的遗传力,从身高(它大概是可能混淆估算值的变量中受环境差异影响最小的一个了)到教育(它受环境因素的影响可能是最大的),等等,以此来解释城市/乡村选择所体现的环境差异。我们算出的遗传力基本不变,但这也许是因为我们选错了环境指标,于是我们把能想到的都加进去了,结果并没有发生太大的变化。遗传学家又赢了,虽然对手是他们自己。
1700230401
1700230402
1700230403
1700230404
1700230405 基因:不平等的遗传 [:1700229257]
1700230406 基因:不平等的遗传 附录3 一种尚未实践的思路: 主成分分析与家庭样本结合
1700230407
1700230408 我们试图努力验证由估算所得的社会性状遗传力是否过高,但遗传学革命带来了一项关于兄弟姐妹间的研究,这项研究给了我们一个沉重的打击。正如我们之前所言,排除选型婚配的情况,兄弟姐妹之间的基因相似程度平均是50%。但这只是一个平均值,事实上可能存在较大波动性。如果你觉得有些兄弟长得比其他兄弟更像,那么你的感觉可能是对的。由于父母双方的基因重组,基因相似性在不同子女间可能确实不同。1结合前文提及的GCTA分析,我们就可以把遗传相似性与表型相似性结合起来,共同估算遗传力。
1700230409
1700230410 然而我们知道,如果你的父母是选型婚配的,彼此基因相似性较高,那么相较非选型婚配的父母所生的后代而言,你的每对基因之间会更相似(Identity By State,IBS)。如果我们研究兄弟姐妹间的遗传案例,那么影响因素就不只是随机因素,还包括选型婚配。因此,这种家庭内的遗传案例无法模拟理想实验。在这种情况下,我们无法判断影响子代间相似性的究竟是环境因素还是遗传因素,这对希望得出纯粹遗传结果的我们无疑是一个重大打击。
1700230411
1700230412 如果考虑有3个以上孩子的家庭情况,我们可以分析同一家庭中不同孩子之间的遗传与表型差异,即将子代A与B,B与C分别比较。这样的话,我们就能排除父母婚配层面带来的影响,了解单纯由偶然因素导致的IBS程度。与所有统计模型一样,这种方法也需要进行一系列假设,其中之一就是,我们对大家庭的遗传力估算同样适用于小家庭(子女数量不足3人)。同时还必须假设,兄弟姐妹间的表型差异与不同家庭成员的差异是一致的。在GCTA检测下,同一家庭内不同子女间表型的差异度未必等同于两个随机个体间的,也未必与不同家庭的兄弟姐妹之间的差异相等(这可能是因为共同的家庭环境缩小了他们之间的差异)。只要表型的分布差异与同一家庭中子女的基因型差异一致(而且我们假设在整个分布中,遗传相似性的效果呈线性),那么我们就可以用更多家庭内部的表型、遗传差异实例去估算较大范围内的遗传力。此外还需假设家庭内遗传差异的效应可以推广到家庭间,也就是说社会总体情况与之一致,遗传效应不会因为特定家庭而被强化或弱化。然而,这一假设反过来又会受到家庭内部的微小差异及其放大化的挑战。事实上我们发现,在教育方面,遗传差异的影响在同一家庭中更为明显。我们在第三章中对此问题进行过详细的讨论。
1700230413
1700230414 很少有数据集能满足这样的条件:有足够多的较大家庭样本数量,而且家庭中至少有3个子女进行过基因分型。只要想想弗雷明翰心脏研究就够了。这个数据集没有足够的家庭数据,因而无法建立模型去估算数据(我们曾经尝试过)。不过也可能存在其他的方法,能够在实验中模拟出随机基因分型的效果。一种是对父母双方每个位点的基因型进行检测,然后对后代每个位点的基因型进行预测,并计算其与预算平均基因型的偏离程度。从本质上说,这种方法进行的检测是随机的,不受环境与基因分型的影响。换句话说,假如在某个位点上你父母的基因型均为GG,那么你的基因型预算结果也必将是GG。这种情况对我们没什么意义。但是,如果在某个位点上你父母的基因型都是GC,这样你最有可能出现的结果也会是GC,可实际上你的基因型是纯合子(如CC),这时你的基因型就会被记录为+1【C】或-1【G】(依据参照标准而定)。我们可以利用这些“残余”的基因型来计算各家庭间兄弟姐妹的IBS,并分析实际情况与表型预测结果的契合程度。我们也可以对无关个体进行GCTA分析。这种方法的根据在于:通过分解出双亲基因型,并只考虑最后的减数分裂(meiotic division)导致的变异,这样就可以消除环境因素与基因分型带来的影响。
1700230415
1700230416 这方法听起来确实不错,只是包括父母双方与1名子女(俗称“三重奏”)的数据集并不容易得到,具有各民族代表性的数据就更是难上加难了。因此我们可以使用另一种方法来利用重组与隔离的随机性,并用测定血统身份(Identity By Descent,IBD)来取代IBS。IBD不仅意味着两个人在给定位点上有相同的等位基因(G、C、A、T),同时还意味着他们拥有由同一基因复制,并代代相传而来的基因拷贝。因此如果母亲的基因型是GC,父亲是AT,两个孩子都是CT,我们就可以记这一位点的IBD值为2。这是因为两个孩子的C碱基必定都来自母方的同一基因,而T碱基则必定都来自父方的同一基因。但另一种情况下,父母基因型分别为CC与TT,孩子们则均是CT(这种情况是可能发生的),其IBD值就只有1。但我们无法断定两个孩子的C是否来自同一个C的拷贝,也就是说,不知道这个C是否由祖父母中的同一人提供。由于这种不确定性,我们只能记C这一碱基的IBD值为0.5,而T也是同样的道理,所以最后IBD值之和为1。当我们对整个基因组进行这种处理时就能算出总的IBD百分比。如果得到父母双方的基因型信息,我们就能更加确定IBD的分配。实际上我们对一个家族谱系的信息掌握得越详细,我们就越容易推断基因的IBD。但当我们不确定时,我们仍然可以基于人群之中的等位基因频率来进行概率分配。虽然测量不准确会导致更多错误,但这一方法还能生成一个随机分布,这个随机分布不受选型婚配与人群分化的影响。即便同父同母,你与某个兄弟姐妹之间的相似度也可能只达到50%以上,而与其他兄弟姐妹间的IBD值则可能为40%或60%。现在有了一个简便的方法,既能测量遗传相似度中随机分布的部分,又能了解如何较准确地预测兄弟姐妹间的表型相似度。最终结论是,模拟双生子情形的遗传力估算(约0.8)比GCTA分析更加有效。有研究曾借“通过澳大利亚的双生子研究身高问题”的事例来检验这种方法(选择身高作为研究对象,是因为这一性状易于检测,并且与遗传因素的关联度较高)。我们对社会经济情况做过同样的处理,其中相关数据来自一份瑞典的双生子样本(选择瑞典样本是因为美国没有足够的案例)。结果是我们又一次失败了:测得的教育相关遗传力为25%,低于双生子模式下的估算,高于GCTA分析的结果。最终,我们依然无法破解谜团。
1700230417
1700230418
1700230419
1700230420
1700230421 基因:不平等的遗传 [:1700229258]
1700230422 基因:不平等的遗传 附录4 表观遗传学及其在遗传力缺失中的潜在作用
1700230423
1700230424 一个试图解释遗传力缺失的理论认为,表观遗传标记同样可以遗传,并且能够解释一些结果中的差异。DNA在储存状态时圈绕在组蛋白上,与之形成染色质或异染色质,而表观遗传标记则是连接在DNA和组蛋白上的化学分子。这些标记是基因表达调节的几种机制之一,也就是说,这些标记会影响RNA从DNA中转录出来的时机与位点,从而影响基因产物(通常是蛋白质)的表达。在DNA序列中,紧跟着鸟嘌呤(G)的胞嘧啶(C)上可以连接一个甲基(-CH3)。这样的CpG位点(p代表DNA主链中碱基之间的磷酸酯)就会不成比例地存在于基因的调控区域:在编码区和内含子序列之前的启动子区(编码区是被复制的部分,而内含子是在RNA转录后的加工阶段被切除的编码区内部分)。1当甲基连接到CpG序列中的C时,它一般会降低相关基因被转录的可能性(甲基抑制或关闭了这个基因的功能)。如果我们创建一个CpG岛(CpG island)——一个由众多“胞嘧啶—鸟嘌呤”对组成的序列——就可以获得一个调控热点(regulatory hotspot)。甲基化是一种相当稳定的标记方式,并且有助于防止发生胞嘧啶的脱氨基。胞嘧啶脱氨基后会转变为尿嘧啶(U),进而使细胞内分子机制的运作发生问题。我们可以将甲基想象成一个插在胞嘧啶上的减速带,这样转录机制就很难沿着DNA链发挥作用。因此,高度甲基化的基因倾向于保持沉默状态。
1700230425
1700230426 这种在不同时间与不同地点对基因进行开启和关闭的功能对于机体发育是至关重要的,因为不论是神经元、骨细胞还是肝脏细胞,机体内的每个细胞都拥有同一套DNA序列。因此,甲基化和组蛋白乙酰化等表观遗传标记等因素(如转录因素的浓度梯度和某些关键的基因激活蛋白的空间浓度差异)参与了组织的分化,让一些细胞成为指甲,而另一些成为神经元。虽然甲基化程度在生物体的生长与衰老过程中趋于增加(一些研究者以此构建表观遗传时钟,以确定某一组织或人的“真实”年龄,而不是根据流逝的时间来定义),但是它也受到环境变化的影响(见图A4.1)。2
1700230427
1700230428 现有研究已经充分证明,当怀孕的小鼠非常紧张时,其后代的糖皮质激素受体基因的启动子区域甲基化程度更高。由于下丘脑中的糖皮质激素受体相当于皮质醇(机体主要的应激激素)释放的开关,当小鼠幼崽出生时,它们倾向于拥有更高的压力应激反应,因为它们的开关较少。换句话说,它们一直处于高度警觉的状态。母鼠利用生化信息告诉后代,它们很可能出生在一个充满压力的世界中,因此为了生存下去,应当维持更高的唤醒状态,然而保持这一状态会带来长期的代价。虽然甲基化比较稳定,但它并不是永久不变的,其更像是一个突变。所以当这些幼崽被一只非常镇静的母鼠收养,并被母鼠精心照料、梳理舔舐毛发后,这些甲基标记将被擦除,之后皮质醇水平下降,幼鼠也会变得平静。甲基化并不是一个短期的快速反应,而是中长期的反应。一次被老板训斥的压力并不一定就会使我们的糖皮质受体基因甲基化,但是长期和尖酸刻薄的同事相处可能会导致我们的表观基因组发生变化。
1700230429
[ 上一页 ]  [ :1.70023038e+09 ]  [ 下一页 ]