​Science丨亓磊团队揭示增强子嵌套多层结构调节基因组

收藏
关键词: 基因组揭示Science基因
资讯来源:BioArt
发布时间: 2022-08-21

责编丨酶美


随着人类基因组计划和表观基因组计划的完成,研究者们发现在人类的基因序列中有多达97%左右的DNA序列是不编码任何基因的,虽然这些序列不编码基因,但是它们却和发育和很多复杂疾病的发生有着重要的关联。有趣的是,研究者们还发现超过90%单核苷酸变异(single nucleotide variant,SNV位于非编码序列,这些位于非编码调控序列的SNV通过调节基因表达在很大程度上影响了细胞的功能和疾病的发生。然而目前我们缺少全基因组非编码序列的调控图谱:一个全面的功能图谱包括各种不同的非编码调控序列以及他们的各种不同的分子调控机理,根据这个图谱,研究者们就可以去解读海量的非编码DNA变异,这是功能基因组学目前遇到的一个挑战。


增强子是在高等动物尤其是人类基因序列中的存在的一种非编码调控元件,能通过与启动子之间的远距离相互作用进而调控基因的表达。很多癌症相关的SNV发生在增强子区域,提示了这些区域的重要作用。特别地,很多疾病相关基因,例如原癌基因,经常由多个增强子一起作用调控基因表达,而且这些增强子相互之间距离极远(>Mb)但是研究者们目前并不清楚一个基因为何需要多个增强子?他们又如何互相协调?他们的异常调控又如何影响病症?


2022年8月11日,斯坦福大学亓磊(Lei Stanley Qi)团队在Science在线发表题为Nested Epistasis Enhancer Networks for Robust Genome Regulation 的研究论文。研究人员应用CRISPR干扰(CRISPRi)高通量多重筛选技术和机器学习方法,以定义增强子-增强子功能相互作用网络。该研究揭示了多个增强子形成具有嵌套的多层结构互相作用,上位性相互作用网络保持基因高水平表达和赋予基因表达的稳定性实验数据证明,增强子上位性相互作用是通过染色体三维相互作用和 BRD4 高浓度聚集来维持的。




为了将发现的上位性相互作用网络扩展到更多的基因,以及难以实现大规模功能性筛选的细胞类型,研究人员通过开发机器学习算法,整合高通量多重筛选功能数据和多组学数据,解码增强子上位性相互作用网络的关键调控因子,建立了增强子上位性相互作用网络的预测模型。由该预测模型在不同细胞类型中对多个致病基因(多个增强子调控,增强子之间距离很远)的预测都得到了相应的实验验证。更多关于具有上位性互相作用增强子的预测可以在研究人员建立的资源网站进行检索:http://enhancer.stanford.edu。


另一方面,全基因组关联分析(GWAS)发现超过90%与疾病和性状关联的SNV位于非编码序列,包括增强子。尽管绝大多数的非编码区SNV效应非常低,但有限的例子提示同时调控一个基因的多个增强子上的非编码SNV很可能通过互相协同作用显著扩增调控效应,从而显著影响致病基因表达,导致了疾病发生的高风险。传统的GWAS分析方法仅仅考虑单个非编码SNV对疾病的影响,而任意考虑两个非编码SNV互相作用的方法缺少统计功效,计算效率和相关的生物机制解释,所以非编码SNV的解析极需一个具有普适性的非编码调控元件功能性的相互作用网络图谱来提供有效地引导(哪两个非编码SNV更可能具有上位性互相协同作用)和进行生物机制解释(非编码SNV导致增强子相互作用网络异常)研究人员开发的关于增强子功能相互作用网络的预测模型为多个非编码SNV的上位性协同作用解读提供了有效的策略和独特的理论。利用这个新的模型,研究人员从全基因组层面全面解析了多个非编码SNV协同作用对急性淋巴细胞白血病复发风险的显著影响,并且比传统的GWAS分析方法更显著有效地鉴定了致病基因。



博士后林雪秋博士,刘艳霞博士和美国国家卫生研究院博士后刘帅博士为该论文共同第一作者。斯坦福大学王永雄Wing H. Wong课题组和美国国家卫生研究院赵可吉课题组参与了本文章的合作。


原文链接:
http://doi.org/10.1126/science.abk3512


制版人:十一


转载须知

【非原创文章】本文著作权归文章作者所有,欢迎个人转发分享,未经作者的允许禁止转载,作者拥有所有法定权利,违者必究。