Cell | 樊少华等利用全基因组测序揭示非洲人群的复杂演化历程与对环境的适应性进化

收藏
关键词: 揭示基因测序Cell基因组
资讯来源:BioArt
发布时间: 2023-03-03


现代人类起源于非洲,相比于其它大陆,现代人类在非洲居住时间最长。并且在迁徙,融合和对环境适应性进化的过程中形成了超过3000个民族和2100种语言。目前非洲人群不仅具有世界上最丰富的遗传多样性和表型多样性,并且现代人类近三分之一的语言都在非洲,是全世界语言最为多样化的地区之一。但是目前的遗传学和基因组学的研究中,只有不到3%的样本来自非洲,存在严重的滞后性。

研究非洲人群遗传多样性不仅将加深我们对于现代人类起源、早期遗传结构以及适应性进化的理解,并且也能为健康和诊断研究及开发提供丰富的新遗传信息。

2023年3月2日,宾夕法尼亚大学Sarah A. Tishkoff团队 (共同一作为复旦大学樊少华青年研究员和斯坦福大学Jeffrey P. Spence) Cell上发表了文章 Whole-genome sequencing reveals a complex African population demographic history and signatures of local adaptation 。研究中对极具代表性的非洲12个群体180个个体进行全基因组测序分析。这些民族地理分布广泛,以不同方式为生 (包括农业,打猎收集和游牧) ,并且涵盖了非洲四个主要的语系。



基于人类参考基因组,研究发现共发现三千两百万个单核苷酸多态性位点 (single nucleotide polymorphism, SNP) ,其中大约五百三十个位点是在之前没有发现的。这些新发现的突变广泛的存在于增强子,启动子以及转录因子结合位点等基因组功能区域。

研究发现这12个民族的平均SNP个数和遗传多样性均具有显著的差异。以打猎和收集为生的桑人 (Ju|’hoansi和!Xoo) 和热带雨林小矮人 (rainforest hunter-gatherther, RHG) 的SNP数量和遗传多态性最高,而Amhara,Fulani,Chabu以及Hadza等民族的遗传多态性则最低。研究发现大量的非非洲人的基因渗入 (Amhara和Fulani) 以及严重的群体瓶颈 (Hadza和Chabu) 是造成遗传多态性低的主要原因。例如,生活在坦桑尼亚的Hadza和埃塞俄比亚的Chabu群体的人口数量已经少于1000人。


利用邻近距离法 (Neighbor-joining method) 对本研究中的12个民族,和来自千人基因组的欧洲人群 (CEU) ,北方汉族 (CHB) ,托斯卡纳人群 (TSI) 以及西蒙斯基因组多态性研究计划 (Simons Genome Diversity Project,SGDP) 中的巴布亚人群(Papuan)进行系统计划分析发现,现代桑人 (Ju|’hoansi 和!Xoo) 的祖先是现代人类最早发生分歧的一支,随后发生分歧的是热带雨林小矮人的祖先。其他民族在系统进化树的聚类模式与他们目前所处的地理环境显著相关,这说明地理环境是制约不同民族间基因交流的重要因素。

现代桑人和小矮人祖先的早期分歧的现象也被主成分分析 (principal component analysis, PCA) 和ADMIXTURE所支持。同时PCA和ADMIXTURE分析在目前坦桑尼亚说Kheosan语言的Hadza和Sandawe的基因组中也发现了桑人相关的祖源成分。

虽然仅有南部非洲的桑人以及东非坦桑尼亚的Hadza和Sandawe说Khoesan语言, 研究中利用PCA分析将之前发表的来自不同地区的55个古非洲人样本投射到现代非洲人样本中。研究发现大量的来自不同地区的古非洲人被投射在桑人和东非Hadza和Sandawe人群之间;但是这些地区目前却没有讲Khoesan语言的民族。该结果提示Khoesan语系的地域分布曾经非常广,遍及整个非洲, 但是可能受到班图大迁徙的影响目前大都灭绝。

由于受到基因交流 (gene flow) 和遗传重组 (recombination) 等因素的影响,邻近距离法,主成分分析和ADMIXTURE无法用来构建现代人类早期遗传结构。但当将这些因素纳入到复杂模型中,发现现代桑人和小矮人的共同祖先,而不是现代桑人的祖先,是现代人类最早分歧的一支。并且研究推断现代人类的分歧发生在28万年前,这与之前的考古和基于古DNA推断的时间一致。


研究中还结合正选择分析的算法、功能基因组学手段和方法以及大规模全基因组关联分析的结果,对12个非洲民族特异的适应性进化进行研究,全面的绘制了一副非洲人群适应性进化的图谱。

肤色多样性是现代人类对于不同维度地区适应性进化的一个重要标志。桑人是非洲人群中肤色最浅的民族,但是研究对于桑人浅肤色的遗传学基础仍然缺乏了解。利用功能基因组学等方法,本研究发现一个位于PDPK1基因内部增强子的突变rs77665059-C,是影响桑人浅肤色的一个决定性的因素。该增强子仅在黑色素细胞中特异活跃,使用Crispri沉默该增强子会降低PDPK1基因的表达量和黑色素和合成。研究进一步发现rs77665059-C在桑人中尤其是!Xoo中频率超过了80%;但是在其它非洲 (平均频率14%) 和非非洲民族中 (平均频率3%) 频率却显著的低。研究发现rs77665059-C突变会导致PDPK1基因增强子在黑色素瘤细胞系中活性降低,降低PDPK1基因的表达,并且与桑人中的浅肤色表型显著相关。为桑人的浅肤色进化的遗传学研究提出了新的解释。

原文链接:
https://doi.org/10.1016/j.cell.2023.01.042

制版人:十一


转载须知

【非原创文章】本文著作权归文章作者所有,欢迎个人转发分享,未经作者的允许禁止转载,作者拥有所有法定权利,违者必究。