
转座子等可移动元件可以调节早期发育到肿瘤的多种生物学过程。但是新生的可移动元件很难被二代单细胞测序方法进行检测,因为可移动元件存在高度重复的序列,很难将测序结果映射到基因组中特定的位点。如果能将现有的长读取单细胞RNA测序分析方法与计算方法相结合,可能能够将转座子的表达映射到特定的位点上。
2021年11月15日,英国剑桥大学John C. Marioni 研究组发文题为Locus-specific expression of transposable elements in single cells with CELLO-seq,构建了能够用于在单细胞分辨率上对位点特异性可移动元件进行检测的新方法CELLO-seq。
单细胞scRNA-seq的出现大大提高了人们对于单个细胞中转录组的认识【1】。但是由于目前大多数的scRNA-seq方案使用的是短读测序,且倾向于标记转录本的3’或者5’端。因此,想要转座因子单细胞表达仍然很具挑战。转座元件在多种生物学中扮演着重要的角色,根据转座方法可以将转座元件分为两大类,第一类是由RNA中间体介导,第二种是由DNA中间体剪切-粘贴机制(‘Cut-and-paste’ mechanism)介导。为了对这些转座元件进行测序,作者们利用了长读单细胞测序方法,使用了22个核苷酸的、长的独特分子标识符(Unique molecular identifiers,UMIs)抵消测序中出现的高错误率,从而建立了的CELLO-seq的测序方法(图1)。
图1 工作流程
随后作者们希望根据已发表数据的对比,对CELLO-seq的性能进行评估。其中一个数据库包括6个人工分离的两细胞阶段小鼠卵裂球,该数据库所包含的测序数据经过了深度测序。另外一个数据库包含96个人诱导多能干细胞,测序深度较浅。作者们发现CELLO-seq实验方案中,文库中的reads包含标记的序列超过75%,证明了该实验步骤的有效性。随后,作者们建立了计算代码可以对CELLO-seq文库的cDNA分子数据进行加工,可以分解细胞条形码、识别UMIs、错误纠正以及删除重复数据等。该比对结果证明了CELLO-seq检测基因表达能力。为了进一步地验证CELLO-seq的可用性,作者们检测了CELLO-seq与Smart-seq2文库之间的测序结果,作者们发现相较于依赖于短读策略的Smart-seq2测序方法,CELLO-seq用于测量等位基因特异性表达时会出现更少的偏差。
“实践是检验真理的唯一标准”,因此,在对CELLO-seq实验方法的有效性进行鉴定后,作者们希望通过CELLO-seq对小鼠两细胞期胚胎以及一组人诱导多能干细胞卵裂球中转座元件亚型以及特性基因组位点的转座元件进行分析,通过三种不同的策略检测,确认了CELLO-seq准确检测L1s等转座因子准确表达的能力。
在胚胎着床前发育过程中,整个基因组被表观遗传重编程,这反过来导致转录组会发生重大变化。作者们希望对这一过程基因组范围内转座元件的表达进行检测,发现不同类别特异性重复类别的转座元件在单细胞中的异质性,这些差异与上游不同的表观遗传调控因子有关,提示出在胚胎着床过程中不同类型转座元件表达的不同调控模式。
总的来说,该工作建立了一种测序方式CELLO-seq,可以对重复的转座子元件进行测序,检测转座元件在特定位点的表达。该测序方法可以用于评估转座元件在两细胞期小鼠胚胎和人诱导多能干细胞中的广泛表达。这一测序以及计算方法的建立将有助于深入了解转座元件生物学与其在调节基因表达中的作用。
参考文献
转载须知
【原创文章】BioArt原创文章,欢迎个人转发分享,未经允许禁止转载,所刊登的所有作品的著作权均为BioArt所拥有。BioArt保留所有法定权利,违者必究。