Nature | 纳米孔测序助力揭示线粒体基因迁徙

收藏
关键词: Nature揭示测序基因Nat
资讯来源:基因谷
发布时间: 2022-10-23

纳米孔测序助力揭示线粒体基因迁徙
在之前的研究中,人们普遍认为线粒体到细胞核的 DNA 片段(NUMT)转移在人类物种产生前就已经完成。作者分析了来自 66,083 人(包括 12,509 名癌症患者)的全基因组序列,使用 Nanopore测序 进行验证并检测NUMT的甲基化,展示出线粒体 DNA 仍然在不断转移到细胞核中,从而形成了复杂的 NUMT 环境。超过 99% 的人至少有 1,637 种不同的 NUMT 中的一种。NUMTs 优先涉及非编码线粒体 DNA,将转录和复制与其起源联系起来;核插入涉及多种机制,包括与 PR 结构域锌指蛋白 9 (PRDM9) 结合相关的双链断裂修复,肿瘤特异性 NUMT 的频率因癌症而异,展现出高度异质和动态的人类 NUMT 格局。
作者用全基因组测序的方式获得“嵌合序列”——部分片段和线粒体有良好匹配,另一部分能够比对到核基因组。通过筛选5对序列以上支持转移片段来确认NUMT的插入片段和插入位置。

图 1. 分析方案

研究结果


1. 人类种系NUMT图谱

图2. 53,574人的NUMT检测

经过质量过 滤去除一些低质量的样本后,最后有53574个样本进入后续的分析。每个个体平均含有4.7个NUMTs。根据NUMTs的出现频率,将NUMTs分为以下几个类型: Common(频率>1%),Rare(0.1-1%),private (频率<0.1%)。NUMTs插入核片段的长度普遍较短,63.2%的NUMTs小于200bp,其中NUMT主要来自线粒体的D-loop区域。
2. NUMT与人群结构

图3. 不同群体的NUMT

根据线粒体核心变异位点进行主成分分析,可以看出不同人群之间存在显著分布特征。东亚人群所包含的NUMTs的数量在所有测试人群中数量最少,并且东亚人群和非洲人群的NUMTs数量差异最大,而欧洲和美洲人相似性更高。


3.  ONT数据 确认插入真实性和甲基化分析
作者挑选出39例样本进行了 三代测序 分析,使用Nanopolish识别测试数据的甲基化模式。
分析结果表明短读长(NGS)数据发现的184个NUMTs插入模式中有182个被三代测序数据确 认真实存在,并且给出更确切的位置信息。大部分插入核基因组的NUMTs相比于其在线粒体有更高的甲基化水平,说明插入片段的表达受到了抑制。

图4. 家庭成员的甲基化水平比较

根据线粒体和NUMTs的甲基化水平模式,作者发现NUMTs可以模拟线粒体DNA的父系传递,产生类似于线粒体DNA异质性的混合等位基因模式。

4. De novo NUMTs

为了探究线粒体DNA是否忍让有进入核内进程,作者定义在一个家庭中,如果在孩子的核基因组上发现的NUMTs并未在其父母的基因组上发现,也不是来自孩子其他NUMT的插入重组,并且至少有5对以上的测序序列支持,则认为这个NUMTs为 Denovo NUMT。

图5Denevo NUMTs家庭插入位置和插入片段

在 8021个(父-母-孩子)研究家庭中,只有两个家庭存在Denovo NUMTs,得到现有的NUMTs的发生频率为2.44x10-4,由于一些短的NUMTs和1kb以内的NUMTs被归类为同一个NUMTs,所以以上计算的频率可能会被低估。

5. NUMT 肿瘤特异性

对肿瘤进行分类,研究不同类型的特异性NUMT会为肿瘤的检测治疗提供一个新的思路。作者对12,509 对生殖细胞和癌症细胞的样本进行分析,结果显示特异性的NUMTs在19号染色体的频率更高,在16号染色体的频率最低。通过分析插入位置以及相关基因功能区,作者认为局部序列特征、基因组不稳定性以及由于癌症细胞的宽松的进化限制而导致选择去除特定 NUMT 的机会较少。


总结


NUMTs  以前 被认为是mtDNA 易位事件的古老残余物,通常在相关物种之间共享。 而这次的分析结果表明 NUMT 的形成是一个持续的过程 。这导致了人群中 NUMT 的高度多样性,14.2% 的人在 1,000 人中不到 1 人中发现了超罕见的 NUMT。然而,NUMT 大小与其在群体中出现的频率之间的反相关性表明选择性过程平衡了 NUMT 插入、保持基因组大小和去除影响基因表达的 NUMT。尽管 NUMT 可以涉及整个 mtDNA 分子,但 NUMT 断点在非编码 D 环中更为常见,包括重链和轻链复制的起点。这增加了 mtDNA 缺失参与 NUMT 形成的可能性。然而,更令人信服的解释涉及 mtDNA 转录和相关复制,其起源于 D-loop。在这里, 作者 展示了 DNA 转移机制保持活跃,并且每 4,000 名新生儿中大约会修改一次生殖系 细胞 。因此可以 确认 大约 14.5 亿年前开始的内共生至今仍尚未完成

参考文献:
Wei, W., Schon, K.R., Elgar, G. et al. Nuclear-embedded mitochondrial DNA sequences in 66,083 human genomes. Nature (2022). https://doi.org/10.1038/s41586-022-05288-7