『珍藏版』NCB封面综述 | 探索无尽的小RNA宇宙-新方向和新方法

收藏
关键词: 新方法
资讯来源:BioArt
发布时间: 2022-04-13
责编 | 兮


在过去20多年中,非编码小RNA(small non-coding RNAs (sncRNA))的研究不断地给学界带来惊喜。现有证据充分证明siRNA, miRNA, piRNA, 等经典sncRNA在基因转录后调控以及多种疾病发生过程中起着重要的作用。然而,随着测序技术和生物信息分析工具的进步,近年来学界逐步认识到在熟知的经典小RNA之外还存在大量其它类型的新型sncRNA,例如近年来发现的tRNA-derived small RNA (tsRNA)、rRNA-derived small RNA (rsRNA)等。这些小RNA具有比经典小RNA更古老的进化起源,而且它们的生成(biogenesis)可以被多种RNA酶(RNase)和RNA修饰调控,另外它们在细胞的生理功能以及疾病发生中也发挥着重要的作用。目前对这些新型sncRNA及其RNA修饰的研究正在逐步打开探索非编码小RNA宇宙的新纪元。


2022年4月12日, 加州大学河滨分校Junchao Shi、Qi Chen和内华达大学雷诺医学院Tong ZhouNature Cell Biology上以封面故事(图1)发表题为 Exploring the expanding universe of small RNAs 的前沿综述(Perspective)。文章介绍了近年来兴起的对经典小RNA以外的新型小RNA(例如tsRNA, rsRNA, ysRNA)的研究以及这些小RNA与siRNA/miRNA/piRNA在生成和作用机制上的差异;重点讨论了近年来新的测序方法带来的对小RNA类型在组织细胞中组成结构的重新认识,以及对小RNA测序数据进行生物信息分析时的盲区/误区。由于tsRNA/rsRNA等新型小RNA携带有大量RNA 修饰,文章着重讨论了基于新型质谱技术或纳米孔技术对小RNA修饰进行系统定量/定位的方法以及面临的挑战,并指出针对这些小RNA修饰的研究是未来小RNA领域的一个新方向。


图1:Nat Cell Biol 2022年4月封面:探索不断扩展的小RNA宇宙


非经典小RNA在生成和作用机理上的主要特点


由于tsRNA, rsRNA, ysRNA等非经典小RNA的产生主要来自于细胞内其他含有高级结构的较长RNA(例如tRNA, rRNA)的断裂和代谢,因此很长时间以来这些小RNA被认为仅仅是其RNA前体的降解产物而没有受到太多重视。然而近年来越来越多的研究发现,这些小RNA呈现明显的组织细胞特异性,其生成和表达受到细胞环境和遗传因素的精密调控,在许多生物过程中发挥重要作用(例如细胞应激反应、癌细胞转移、干细胞分化、病毒复制、细胞间交流以及早期胚胎表观遗传调控等),并且还可以作为临床上无创诊断的分子标记物。


从演化的尺度上看,tsRNA, rsRNA等非经典小RNA在生物界广泛存在,横跨细菌、古细菌以及真核生物。与siRNA/miRNA/piRNA相比,tsRNA/rsRNA在进化起源、细胞内丰度、生物发生和发挥功能的方式等方面具有一系列特征,这些特点也更新了我们对于sncRNA的传统认识。例如,tsRNA, rsRNA 在不含有siRNA、miRNA 和 piRNA的单细胞生物(比如细菌、古细菌和一些单细胞原生动物)中呈现出动态表达模式且能够发挥功能。这表明tsRNA、rsRNA在进化上出现的时间早于siRNA、miRNA 和 piRNA。这些现象也支持了一种观点,即最古老最原始的小RNA生成途径是:通过降解/断裂/切割较长的 RNA(例如,tRNA、rRNA、snRNA、snoRNA, yRNA和vtRNA)生成小RNA。


此外,tsRNA、rsRNA 等非经典 sncRNA的生物发生涉及其前体RNA(tRNA、rRNAs)通过不同种类的RNase酶家族成员切割产生(例如,RNase P、RNase Z、RNase T2, RNase A) ,这些保守的RNase酶在进化上出现得比负责siRNA/miRNA生成的Dicer酶(仅存在于真核生物中)更早,并且tsRNA/rsRNA的生成受到多种RNA修饰以及相关修饰酶的调控。


在行使功能方面,siRNA/miRNA/piRNA主要是通过与Argonaute(AGO)家族蛋白结合对目标序列实现RNAi效应(例如,参与转录后mRNA切割、降解、翻译抑制,或转录沉默);而tsRNA/rsRNA等非经典sncRNA可以独立于AGO蛋白家族成员行使功能。针对这方面的研究尚处于起步阶段,也有待未来进一步探索。


此外,为了今后对非经典小RNA命名统一,文章提出了一套标准命名规则如下:


【笔者按:本文提出统一小RNA命名的背景是因为目前学界对于非经典小RNA的命名比较混乱。例如tsRNA在一些文献中也被称为tRNA-derived fragment (tRF),或tRNA‐derived stress‐induced RNA (tiRNA)。这些名称具有各自的历史沿革,比如tiRNA的命名是由于最初发现这些小RNA受细胞应激诱导产生。然而后续研究发现,在生理情况下tsRNA也大量存在,故而tiRNA这个名字不再具备普适性。而tRF则简单地把这些RNA称为tRNA的片段,名字本身会让读者产生这是一类‘不太重要的RNA降解产物’的错觉,不能很好地体现tsRNA是一类不同于miRNA等经典小RNA的具有独特功能的新型小RNA。】


新的测序方法—重新认识组织细胞小RNA全景图


尽管对各种新型非经典小RNA功能和机理的认识还处于起步阶段,近年来的针对非经典小RNA的系统发掘和测序技术已经取得一系列重要进展。研究认识到,许多tsRNA/rsRNA具有与siRNA/miRNA/piRNA不同的末端和内部修饰,这也导致了针对经典小RNA的传统测序方法无法对非经典小RNA进行有效地发掘(这也是过去对于tsRNA/rsRNA等小RNA关注不足的原因之一)。近年来随着学界认识到这个问题的严重性,对RNA修饰特性的研究催生了一系列新方法来克服这些RNA修饰带来的测序问题,这些最新的测序方法也促使学界对小RNA在组织细胞中的表达图谱有了全面的重新认识。


例如,PANDORA-seq, CPA-seq等技术通过一系列酶学处理,解决了由于RNA末端修饰导致的接头连接问题,以及RNA特定甲基化修饰妨碍逆转录过程的问题。和传统小RNA测序结果相比,PANDORA-seq等方法的测序结果揭示了完全不同的小RNA全景图(landscape)。例如,大多数哺乳动物组织细胞中,miRNA的占比要远低于tsRNA 和rsRNA的占比,并且在一些组织细胞(例如脾脏,胚胎干细胞,Hela细胞,成熟精子)中tsRNA/rsRNA的含量占绝对多数。


『编者按:miRNA在很多组织细胞中的占比很少这个发现为研究其它类型的sncRNA打开了一扇新的大门,定有大量新的宝藏等待未来被发掘(见BioArt报道:1.PANDORA-seq;2.CPA-seq )』


文章审视了小RNA的发掘史,认为这是一个类似“盲人摸象”的故事。随着技术和认知的发展,可能还会有更多种类的小RNA被发掘。今后小RNA测序的改进方向包括进一步优化接头连接效率以及逆转录过程,减少建库扩增产生的偏差,以及在新技术的背景下实现微量/单细胞水平的小RNA建库测序等。


小RNA数据分析及解读中的误区和解决方案


过去小RNA的生物信息工具主要针对miRNA、piRNA等某一特定种类的小RNA进行分析。然而随着测序技术的发展,研究发现同一样本中往往同时存在不同种类小RNA(例如miRNA、tsRNA 和 rsRNA),这对于sncRNA的生物信息学分析提出了新的要求和挑战(见BioArt报道:SPORTS1.0,特别是如何通过测序数据准确推断生物样本之间小RNA的变化情况。为了解决这一问题,研究者需要了解测序数据的产生过程/局限性以及特殊样本对测序结果的影响。文章介绍了sncRNA测序数据分析中的主要注意事项,分析并讨论了不同情况下出现问题的潜在解决方案。


首先,测序结果分析报告中对sncRNA表达量的描述不管是原始读值(raw reads)还是标准化后的读值(例如reads per million (RPM))往往表示对应序列在样本中的相对富集水平,而非其在样本中的绝对数量。因此,不同条件下测序结果中某个小RNA序列的读值变化不一定反映出其真实表达水平的变化。举例来说,如果一个细胞中同时表达 miRNA 和 tsRNA,通过测序发现在某种处理后miRNA的读值相对于正常条件中的读值下降,而tsRNA的相对读值上升。这种测序结果的呈现不能简单理解为miRNA表达的下调以及tsRNA的上调,而可能由以下多种情况导致。例如:1)miRNA表达不变,tsRNA表达上升。由于测序分析时将样本总读值进行了标准化,使得测序结果中miRNA的读值降低而tsRNA的读值升高;2)miRNA表达降低,tsRNA表达不变。同样地,对读值的标准化导致了最终测序分析结果中miRNA的读值降低而tsRNA的读值升高;3)miRNA表达降低,tsRNA表达上升(图 2)因此,如果只通过读值本身的变化来评估小RNA表达的变化是不够的,甚至会导致对测序结果的系统性误读,使得后续的实验方向(例如选择具体上调/下调的小RNA进行验证研究)与预期目标南辕北辙。

图2:sncRNA测序结果中基于RPM的小RNA变化模式可由细胞内部多种表达情况产生(miRNA, tsRNA的相对变化)


为了校准测序结果,其中一种策略是对选定的多个sncRNA进行 Northern blot分析,通过被探测的RNA条带的亮度衡量其真实表达量。这一过程中针对不同条件的样本,较优选择是使用相等的总RNA量,而非使用某些看家(housekeeping)RNA作为内参,这是由于这些看家RNA的表达量在某些条件下也可能发生改变,从而影响判断。


另一种矫正策略是通过在构建RNA测序文库过程中添加外源spike-in RNA,从而建立定量标准曲线。然而添加spike-in RNA的基准选择尤为重要:如果基于相等的RNA含量添加等量spike-in RNA时在某些情况下也会产生系统性的误差。例如,在细胞数量相等的情况下,一些癌细胞中总RNA的含量是正常细胞的2-3倍。如果根据相同总RNA水平添加等量的spike-in RNA则会导致癌细胞中小RNA的表达水平被系统性地低估。因此,文章推荐基于相等细胞数量而非相等RNA量添加spike-in RNA。然而,对于含有大量细胞的组织进行细胞数目的精确定量并不现实。而在细胞数目很大的情况下,计数的微小偏差也会带来小RNA定量的系统性误差。因此未来的研究方向旨在降低测序测序所需细胞数量,理想情况下通过在单细胞中添加spike-in RNA,从而实现对小RNA的绝对定量。


【编者按:这些小RNA分析时的问题值得相关实验室或测序分析平台在实际操作中特别关注,随着各种新型sncRNA的出现,这已经是实验设计和生信分析中不可避免需要解决的问题】


对小RNA全修饰谱进行直接定量及定位新方法与新挑战


过去研究者往往更为关注小RNA本身的序列,而忽视了小RNA上的修饰信息。但越来越多的证据表明,RNA修饰信息是小RNA功能中不可或缺的一环,例如对调节RNA稳定性、RNA结构、RNA结合的潜力等具有着重要作用。这个问题对于tsRNA等来源于被高度修饰的前体RNA(tRNA拥有超过150种不同类型的RNA修饰)的非经典小RNA显得尤为重要。然而,目前大多数小RNA的修饰仍然无法被检测或被定位。这很大程度上是由于当前主流的RNA测序方法实际上是对RNA反转录获得的cDNA进行测序(而不是RNA序列本身),因此大部分的RNA修饰信息在反转录过程中被丢失了。目前已有的特定位点的RNA修饰检测方法往往针对的是长RNA上的修饰,可检测的修饰种类(例如m5C、m6A、ψ、I、m1A,ac4C)也受到限制,且这些方法通常只能鉴定其中一种修饰类型。为了分析包含大量修饰的非经典小RNA的全修饰谱,领域迫切需要可以直接对RNA进行测序并同时对所有RNA修饰进行定位和定量的方法。针对这一问题,目前有两类方法正在开发和发展中,一是基于新型质谱的测序技术,二是基于纳米孔的测序技术(图3)


【编者按:由于通过建立cDNA文库来进行RNA测序的方法在同时捕捉多种RNA修饰方面具有固有的局限性,最近多家实验室联合在Nat Genet 2021 (https://doi.org/10.1038/s41588-021-00903-1) 发布了一篇call for action的倡议: 文章旨在鼓励NIH等主要科研机构应当大力支持独立实验室从头开发新一代不基于逆转录的RNA直接测序技术,从而对全部RNA修饰进行系统解析,这个倡议与本文介绍的内容遥相呼应】


新型质谱技术:


液相色谱串联质谱(LC-MS/MS)技术已被广泛用于分析 RNA 修饰并被认为是对RNA修饰定性和定量的“金标准”。LC-MS/MS的传统优势是可以测量特定的RNA片段或单个核苷酸的分子量,从而推断出RNA上的修饰种类。然而由于RNA在质谱检测前往往需要被消化成更小的片段或单核苷酸,使得原始RNA修饰的位置信息被丢失。为了解决这一问题,研究人员提出一种可能的实验方案,即通过处理将RNA逐核苷酸梯度降解成不同长度的RNA片段(形成mass ladder),再利用质谱差值获得末位核苷酸及修饰信息(图3)。这一方案与Sanger法DNA 测序策略类似。但这一方案的难点在于如何准确获得一套完整的mass ladder。


2015 年,Jack Szostak实验室发表了一篇具有里程碑意义的论文,开发了一种通用且高效的方法克服了这一挑战。他们发现通过甲酸处理RNA可以可控地对RNA进行片段化并生成较为均匀的各个长度的RNA片段,形成了完整的mass ladder,从而实现了后续利用LC-MS/MS对RNA进行直接从头测序的同时对各个位点的RNA修饰进行直接检测的策略。一系列基于该项技术的后续改进也在进行中,最终目标是实现针对RNA序列和修饰的高通量直接测序。该项技术极大地方便了针对tRNA/tsRNA等被高度修饰的RNA的研究,为了解tRNA/tsRNA 的组织特异性及其在正常和疾病条件下的差异提供了重要的研究手段。


【笔者按:Jack Szostak是笔者最佩服的当代科学家之一,Jack因上世纪80年代参与发现端粒的工作获得2009年的诺贝尔生理学或医学奖,随后实验室又开创了aptamer领域,并通过体外’定向进化’(directed evolution)手段在人工合成筛选功能性核酶(ribozyme)方面也做出了开创性工作。随后他又进军更为基础的问题-研究生命的起源,包括不基于核酶的核酸类似物的化学复制,以及原始生物膜的形成等(每个阶段的工作都具有划时代的意义)。值得一提的是,2020年获得诺奖的Jennifer Doudna,以及miRNA领域的大牛David Bartel都是Jack Szostak实验室进行ribozyme研究时期培养的博士】


图3:基于质谱技术对RNA序列从头测序和RNA修饰的定量定位的技术原理


纳米孔技术:


纳米孔技术的开发来自于对天然膜离子通道结构的研究,其技术原理是通过记录不同核酸分子穿过纳米孔时形成的离子电流来判断序列信息。自1996年首次将纳米孔技术用于检测和鉴定单链DNA和RNA序列之后,该技术迄今已经发展了30多年。纳米孔技术不但为直接DNA/RNA测序带来一场革命,也有望用于鉴定RNA上的修饰信息。目前,基于纳米孔的直接测序技术已经实现了对m6A、ψ,2'-O-methylation等修饰信息的测序,并基于机器学习对修饰信息进行了定位。然而,目前对于同时检测多个RNA修饰以及被高度修饰的RNA仍然非常困难。


使用纳米孔技术同时准确定位多个RNA修饰的一大难点在于:一个特定的RNA修饰不但会改变修饰位点的离子电流,而且会影响附近位点的电流(这是由纳米孔蛋白的物理和化学性质决定的)(图 4)。尤其对于tRNA/tsRNA等被高度修饰的RNA而言,不同RNA修饰的影响可产生不计其数的重叠效应,为准确判定修饰位置带来很大的困难。理论上可以通过合成各种不同的带有已知修饰的RNA获得数据建立机器学习模型解决该问题。然而由于目前许多RNA修饰还不能进行有效的实验室合成使得这一方向困难重重,仍然需要大量的技术投入。


提高纳米孔测序准确性的另一个方向是改进(例如位点特异性突变)现有的纳米孔道蛋白,采用新的孔道蛋白或者使用其它不基于蛋白的新型纳米材料孔道,最终找到能够更准确灵敏检测特定RNA及其 修饰的孔道材料。


图4:基于纳米孔技术对一条RNA上多种RNA修饰进行定位的主要问题以及今后的改进方向


总结与展望


除了系统捕获具有所有小RNA及其RNA修饰以外,小RNA在亚细胞水平的空间组学仍方兴未艾。相对于mRNA/lncRNA的空间转录组研究,小RNA的空间组学研究难度更大。这主要是因为小RNA的序列较短,不容易获得特异的原位杂交信号;另外小RNA上的密集修饰也可能影响探针杂交效率。这些均为今后亟待解决的问题。


另一个更为深层和长期的问题是如何研究小RNA的功能和工作机理。文章使用“RNA代码”来描述小RNA其所包含的复杂信息,其中包括但不限于它们的序列信息及位点特异性RNA修饰信息;它们与靶RNA、DNA及蛋白结合的能力,以及小RNA在细胞内和细胞间的社会行为(如竞争和协同对共同目标的影响)。如何结合细胞生理学特性系统地解码这些RNA信息在当下仍然极具挑战性,同时这也说明小RNA的研究代表了一个无尽的前沿方向,值得新一代研究人员(和机器)运用其智慧进行不断探索。


【编者按:本中文报道仅节选了综述中部分重要内容,对小RNA研究感兴趣的老师同学建议阅读原文】


原文链接:

https://doi.org/10.1038/s41556-022-00880-5


制版人:十一

转载须知

【非原创文章】本文著作权归文章作者所有,欢迎个人转发分享,未经允许禁止转载,作者拥有所有法定权利,违者必究。