摘要当人群所生存的环境发生变化,或者迁移进入一个新环境时,所面临的气候条件、饮食结构、周围的病菌的变化等,都要求人群在生理水平上做出相应的响应,来应对和适应所面临的变化。如果这些环境因素进一步影响到人的生存和繁衍,则会在不同程度上影响到等位基因频率和人群的遗传多样性。人群的遗传多样性,为群体的适应提供了编码适应环境的蛋白进而形成特定表型提供了基础。当群体基因库不能维持在一定的多样性水平,则在面临变化的环境中,可能会由于无法适应相应的环境而面临灭绝。<br> 影响人群遗传多样性的因素很多,如全球气候变暖等宏观环境的改变,群体迁移与扩张等群体事件,诸如尼安德特人等古人的基因渗入,近亲婚配和群体基因交流等,不一而足。近亲婚配,使得后代中来自近期共同祖先的基因组趋于纯合,一般认为会降低遗传多样性,提高了隐性致病基因纯合的概率。而另一方面,由于基因交流而形成的混合群体,其后代基因组中包含有来自不同祖先的遗传组分,通常认为会一定程度上增加遗传多样性。但近亲婚配降低遗传多样性和基因交流会提高遗传多样性,并没有相关的研究系统地去评估该假说。本文研究中,首先系统地鉴定了用于研究亚洲人群遗传多样性的泛亚SNP计划中潜在的近亲关系,并据此建立了由不同水平的无关个体组成的标准化子集。然后利用两个来自中东、近亲婚配现象和基因交流现象并存的两个人群,系统地研究近亲婚配和基因交流对人群遗传多样性的影响并探索其作用机制。<br> 本文的分析表明,来自泛亚SNP数据库中的1719份代表亚洲71个人群的自报告(self-report) DNA样本中,存在3对同卵双生关系(或重复的样本),11组父亲-母亲-孩子三元关系,33对父(母)亲-孩子二元关系,45对同胞兄弟姐妹关系,以及161对二度近亲关系。并据此推荐了三个由不同水平的无关个体组成的标准化子集PASNP1716、PASNP1640和PASNP1583。在两个中东的人群中,从SNP水平、个体水平和单体型水平三个层次,均观测到比非洲以外(non-African)的其他参考人群中更高的遗传多样性;与此同时,两个群体中观测到比其他任何人群都要高的近亲婚配水平;相应地,也呈现出更多数目和更多总长度的纯合片段ROH。利用F3检验,发现两个中东人群中接收了来自非洲人群、欧洲人群和亚洲人群的基因流。通过构建数学模型,本文从SNP位点水平和个体水平上一致地确认了在中东人群中,近亲婚配会降低遗传多样性,而基因交流会提高遗传多样性,并将其影响程度进行了量化。有趣地是,本文还在两个中东群体中发现,基因组上那些亚洲祖先组分高的染色体区域内的基因,均来自嗅觉受体基因家族或与嗅觉感知代谢通路有关,可能与这两个群体共同适应中东地区的环境有关。<br> 在由基因交流而形成的混合群体中,混合事件所发生的时间、发生的次数和发生的规模,对大多数群体而言都鲜有历史记载,并且对于有些历史记载而言,由于受到立场等因素的影响,其记录并不一定客观真实。幸运地是,利用留存在人类基因组上的印记,能够从一定程度挖掘出隐含其中的历史,用以构建群体的混合历史以及揭示群体适应的原理等。从基因组中挖掘混合历史的方法,有基于重组率估算、基于连锁不平衡和基于混合片段长度分布等类别,但大多数都是基于简单的混合模型假设或者几种特定的模型,与群体混合的真实情形存在一定差距。本文研究的后半部分,首先开发了一个基于普适性的混合模型的正向时间模拟程序,然后推导了基于普适性的混合模型中混合片段长度的理论分布,并提出利用分布来进行群体混合时间估计和模型选择的原则。<br> 经过评估,本文所设计并实现的正向时间模拟程序能够快速地模拟出较大群体在任何情形下的混合事件。而基于普适模型下混合片段长度分布的方法,在模拟数据和真实数据上,均有很好的表现。基于混合片段长度分布的方法,对选择不同片段长度起点阈值不敏感,对样本大小的选择不敏感,以及对群体经历如恒定群体大小、瓶颈效应、指数衰减、指数扩张的群体历史事件不敏感。在实际数据的分析中,推断出美国黑人的混合时间大约12代连续混合模型,与始于17世纪的黑奴贩运的历史相吻合;推断出墨西哥人群混合时间大约18代连续混合模型,与发现新大陆后欧洲人群进入美洲与印第安人混合历史相吻合;推断南亚巴基斯坦人群混合时间大约100代连续基因流模型,与雅利安人入侵印度次大陆、以及后续多个横跨欧亚大陆的帝国的崛起与衰落历史相吻合。随着推断基因组局部区域祖先来源的准确性不断提升,本文发展的方法有望能够推测出更古老的基因交流事件,比如尼安德特人与现代人之间的基因交流等。
更多相关知识
- 浏览0
- 被引0
- 下载0
相似文献
- 中文期刊
- 外文期刊
- 学位论文
- 会议论文