重磅！癌症早筛、肿瘤定位一招搞定，清华大学研究团队破译cfDNA甲基化密码

 收藏

关键词： DNA癌症瘤癌肿瘤研究团队

资讯来源：基因谷

发布时间： 2022-12-22

近日，清华大学的研究团队表明，对来自肿瘤细胞的cfDNA占比进行分析，有助于癌症早筛和肿瘤定位。相关文章以“Tumor fractions deciphered from circulating cell-free DNA methylation for cancer early diagnosis”为题发表于期刊《Nature Communications》上。

doi: 10.1038/s41467-022-35320-3

因筛查具有非侵入性等优点，外周血浆中的循环游离DNA（cfDNA）一直被视为液体活检的明星标志物，对癌症早筛有着重要价值。一般来说，健康个体血浆中的cfDNA来源于造血细胞和正常组织。而在癌症患者体内，来自肿瘤细胞的降解DNA片段也会被释放到血液中，与正常来源的cfDNA一同构成总cfDNA。但来自肿瘤细胞的cfDNA数量太少，不足以单独用于常规诊断，所以该生物标志物的应用一直受限。

为精准评估来自肿瘤细胞的cfDNA，量化其在总cfDNA中的占比，全基因组测序法（WGS）、ichorCNA法、ACE法近年来先后被提出，但这些方法各有各的劣势，无法解决根本上的难题，可靠稳健地评估来自肿瘤细胞的cfDNA占比。

清华大学研究团队注意到，在健康个体与肿瘤患者之间，DNA甲基化特征有着很大的差别，而近年来多项研究详细分析了两群体当中的差异甲基化位点/区域（DMPs/DMRs）。同时，cfDNA有多种来源，每一CpG位点的的甲基化水平本质上是造血细胞和其他组织的混合信号，包括肿瘤细胞。

于是，研究团队想到了通过cfDNA甲基化特征构建SRFD-Bayes模型，用去卷积的方法估计来自肿瘤细胞的cfDNA占比，并进一步对其定位。

注：去卷积法，是用于估计混合物（数据点）中每种细胞类型的比例以及每个细胞的基因表达水平（在同一数据点内）的算法。

The overview of cancer early diagnosis approach

首先，研究团队基于矩阵范数设计了一个评分系统，以从大量的差异甲基化位点中识别类型判别(TD)和类型特异性(TS)甲基化标记。

Informative marker selection and deconvolution results on simulations

接着，研究团队利用自由反卷积算法从混合血浆数据库中学习参考数据库。（包括656个正常血液DNA甲基化图谱和5组来源于癌症基因组图谱的肿瘤组织DNA甲基化数据，囊括浸润性乳腺癌、结直肠癌、肺癌、肝癌和前列腺癌五大癌种）

最后，研究团队将训练好的样本反卷积到单独的源分数向量中，每个癌种的数据都被当做是独立的Beta分布进行拟合，一同构建预诊断模型，也就是SRFD-Bayes模型。

Diagnostic results on the simulation dataset

为在真实世界验证SRFD-Bayes模型的准确性，研究团队选取835名健康个体对照和1050名确诊的肝癌患者的数据进行测试，研究结果表明，SRFD-Bayes模型在癌症早期患者和健康个体上验证时，筛查早期癌症的灵敏度为86.1%，特异性为94.7%，肿瘤定位的平均准确性为76.9%，且来自肿瘤细胞的cfDNA占比，即SRFD-Bayes模型预测的肿瘤分数和肿瘤分期显著相关。

清华大学研究团队表示：“该模型基于晚期肿瘤样本的高度可迁移训练策略构建，在癌症早筛领域的价值巨大，可作为大规模肿瘤筛查或肿瘤进展监测工具。”

点击加入基因俱乐部成就行业精英

目前已有500+行业精英加入基因俱乐部