100kGP:与疾病科研人员的合作可大大提高临床基因诊断率

收藏
关键词: 基因合作临床疾病诊断
资讯来源:基因谷
发布时间: 2021-09-06

来源:基因检测与解读 



在科学研究中对罕见疾病的全基因组测序 (WGS) 的早期评估表明,根据临床表型的不同,它可以提供 21-42% 的额外诊断率,这促进了将 WGS 引入临床诊断。在英国,由英国国家卫生服务中心 (NHS) 通过 16 个 NHS 基因组医学中心 (GMC) 和 Genomics England (GE) 共同实施的 100,000 基因组计划 (100kGP),这个计划为患者提供及时的诊断并改进预测和预防。全基因组测序对那些可变表型或非特异性临床特征的疾病特别有价值,其中致病基因的数量可能很多,并且可以识别非编码变异并解开疾病的新发生机制。
 
GMC 在 2015 年至 2018 年期间招募了 100kGP 参与者,在罕见病项目中,已对 36,012 个家庭的 71,597 名参与者进行了 WGS。GE 创建了一个可更新、众包和疾病为中心的面板 (PanelApp) 为中心的自动化分析流程,用于处理、调用和优先排序基因组序列变异,并将结果返回给招募 GMC 评估并可能验证。目前,GE/GMC 分析流程对罕见疾病的诊断率为 20.3%。
 


100kGP 允许49 个 GE 临床解读合作伙伴的成员机构的学术研究人员访问研究环境中去标识化的临床信息和基因组数据,“诊断发现”描述了学术研究人员识别但未被GE/GMC 分析流程标记的潜在诊断返回给 GMC 的过程。这将促使 GMC 使用研究人员识别的变异重新分析更新管道上的案例,将研究人员的发现嵌入到诊断过程中。
 
鉴于临床 WGS 所需的测序和数据存储方面的大量投资,确保临床分析流程可以有效识别临床级分子诊断至关重要。鉴于人类基因组变异的广泛性和复杂性(包括单核苷酸变异 [SNV]、微小插入缺失、拷贝数变异 [CNV] 和结构变异 [SV]),这项任务在多种疾病的背景下具有挑战性。在这里,我们使用颅缝早闭 (CRS),一种或多种颅缝线的过早融合,作为一种模型障碍来检查 100kGP 管道的性能,并与研究环境中对数据进行深入审查的结果进行比较旨在生成“真实数据集”。
 
重要的是,CRS 的特征是罕见遗传诊断的长“尾巴”。在牛津调查中,20 个很少涉及的基因的致病变异占所有病例的 23/666 (3.5%),在外显子组/全基因组测序研究中,在 14 个不同基因中确定了15个新诊断。由于我们期望加入 100kGP 的患者因罕见的遗传原因而富集,因此这种异质性对基于分析流程的诊断提出了重大挑战,因此我们认为 CRS 可以代表对 GE/GMC 分析流程工作情况的严格测试。这项工作证明了利用专业研究知识来提高 100kGP 的整体诊断率的巨大好处,并指出了可以改进诊断分析流程的方法。
 
Genomics England 分层概述和 PanelApp 将所有研究人员鉴定的潜在诊断 (RIPD) 等位基因 (n = 25) 分配到不同等级。
 


总共有 127 个主要分类为 CRS 的家庭被招募到 100kGP(图 1)。从起始阶段排除了七个家庭,因为他们的数据在研究环境中不可用;在另外六个家庭中,相关的 HPO 术语中没有注释 CRS 表型。因此,在主要计划中关注了 114 个真正的CRS家庭,包括 15 个有不止一个患者的家庭,以及 72 个散发性的先证者,分析为trio模式。
 


GMC 鉴定的变异
GMC 将 16 种变异(表 1 中的病例 1-3 和 19 以及表 S3 中的病例 23-34)分类为可能致病性或致病性。在 13/16 的案例中,致病变异是从 1/2 级或 A 层数据中确定的(框 1)。在其余三个变异中,在第 3 级数据中发现了 KMT5B de novo 变体(案例 3),而案例 19 中的X-linked OGT 变体和案例 34 中的 denovo ZBTB20变异未分级,但由于各自的 GMC 已经使用了Exomiser检索到变异。
 
研究人员确定的潜在诊断(RIPD)
临床解读合作伙伴(CGG)提交了 22个 RIPD(图 1),其中 20 个(包括 22个变异;18 个单等位基因和 2 个双等位基因)是第3级或未分级。GMC 对每个 RIPD 的评估和验证结果总结在表 1 中。4个变异也被 GMC报告为致病性,这些不再进一步讨论。在剩余的 18 个“仅限研究人员”的 RIPD 中,16 个病例(包含 18个变异)被归类为致病性/可能致病性,两个被报告为 VUS。
 
3级变异
18 个仅研究人员提交的 RIPD(案例 4-13)中有 10 个是3 级变异,不是 1/2 级,因为该基因在分析时应用的基因列表不是诊断级(绿色)。虽然对于三个案例(5, 7, 8),基因现在至少在一个相关面板上具有诊断级别,但 GMC 目前并没有例行重新分析更新基因列表上的案例的过程。其余 7个3 级基因中的变异,在应用于患者的基因列表上仍未被评为诊断性。然而,大多数仍可能完全或部分影响患者的表型。
未分级的少数变异
五个研究人员的 RIPD(案例14-18)案例,包括未分级的 SNV或indel(表 1,表 S4)。案例 14 和案例 15 都属于诊断级基因(MEGF8、MMP21)为隐性遗传模式,但在每种情况下,其中一个变异是杂合缺失(分别为 3 或 14 个核苷酸),由于质控参数而被过滤掉。案例 16 在 ARID1B 中包含一个de novo indel(删除 1 个核苷酸并插入 6 个核苷酸),由于质控也将其过滤掉。在案例 17 中,TRAF7 中的一个 denovo 变异(Exomiser 排名第 3)被从分级中过滤掉了,因为母亲的 32 条reads中也有 1 条reads携带该变异,Integrative Genomics Viewer (IGV)中的检查表明这是由低质量reads引起的。
 
拷贝数变异和结构变异
三个仅研究人员提交的 RIPD(案例20-22)是未分级的 SV/CNV,包括涉及 TWIST1 的复杂倒位(案例 20)、包括 ERF 的缺失(案例21)[31] 和涉及 HOXC 基因簇的重复(案例 22。由于 TWIST1 和 ERF 是 CRS 的诊断级基因,因此在更新的 GE 分析流程上对重排进行了回顾性分析。尽管 ERF 缺失被称为 A 级,但仍然错过了 TWIST1 倒位,因为断点位于基因的两侧。HOXC 重复与独特的颅面表型相关,结论来自已发表的小鼠突变,并被归类为研究发现。
 
 
讨论
这项研究的一个主要目标是利用研究人员的知识改善临床诊断分析流程的方法。在图 2 中总结了漏诊的主要特征,以表明哪些方法可以检测到它们。

 


点击加入基因俱乐部    成就行业精英

目前已有500+行业精英加入基因俱乐部