责编 | 兮
人类基因组的注释
(Annotation)
通常基于以下准则:1. 编码大于100个氨基酸
(cutoff>100 amino acids)
的开放阅读框
(open reading frame, ORF)
。2. 每一条mRNA翻译表达一个蛋白
(annotated protein)
。3.蛋白翻译表达的起始密码子是AUG。少于 100 个氨基酸的微蛋白
(microprotein)
的小型开放阅读框
(small open reading frame, sORF)
,以及来自同一条mRNA翻译两个蛋白:注释蛋白
(annotated protein)
与未注释alt蛋白
(unannotated alt-protein)
的替代开放阅读框
(alt-open reading frame,alt-ORF)
通常被排除在人类基因组注释之外。微蛋白
(microprotein)
和与未注释alt蛋白
(unannotated alt-protein)
调节多种生物体中重要的细胞和生理过程。例如微蛋白 GREP11、CASIMO12和 MP313 与癌症紧密相关,而未注释alt蛋白 alt-FUS4 可能有助于肌萎缩侧索硬化相关蛋白聚集。但是,至今只有十几个microproteins 和alt-proteins被证实存在且具有重要的生物学功能,绝大多数仍处于初期预测阶段。与此同时microproteins 和alt-proteins的亚细胞定位通常是未知的,因此对这些蛋白进行定位分析可加速验证microproteins 和alt-proteins的重要生物学功能。
2022年7月28日,来自于耶鲁大学的博士后那振坤
(Slavoff教授课题组)
与博士后代晓云
(陈斯迪教授课题组)
在Molecular Cell上发表了一篇为
Mapping subcellular localizations of unannotated microproteins and alternative proteins with MicroID
的文章。他们开发了一种高通量技术
(MicroID)
,
通过邻近生物素化技术将未注释的microproteins 和alt-proteins映射到亚细胞结构上。研究发现超过 150 种microproteins 和alt-proteins与亚核细胞器有关。
其中alt-LAMA3蛋白定位于细胞核仁并在核糖体亚基组装中起重要生物学作用。并且进一步在小鼠模型中应用了 MicroID技术,验证了一种保守的微核蛋白的表达。
该技术为未来在体外及动物体内探索microproteins 和alt-proteins提供了重要工具。
作者在该研究中专注于细胞核,探索在细胞核内亚结构功能相关的微蛋白和 alt 蛋白。作者首先将邻近生物素化酶与细胞核亚结构定位蛋白相融合,其中包含fibrillarin
(细胞核仁)
、H2B
(染色质)
、lamin B1
(核膜)
和核定位信号
(3xNLS,整个细胞核)
。通过免疫荧光和蛋白质印迹证实了每个融合蛋白在细胞核亚结构上的定位和蛋白质生物素化的效果。接下来,作者使用SDS-PAGE从每个样品中富集生物素化蛋白并截取小分子量的蛋白进行液相色谱-串联质谱
(LC-MS/MS)
分析。作者总共找到了 154 个未注释的microproteins和 alt-proteins。相应的 smORFs 出现在五个主要转录区域中:5' 非翻译区
(5' UTR)
;规范蛋白质编码序列
(CDS)
错位移码翻译;3'非翻译区
(3'UTR)
;长链非编码 RNA
(lncRNA)
;和反义转录本。研究人员在每个
(亚)
核结构中选择了一种microprotein或者alt-protein进行进一步验证。研究人员采用共免疫沉淀
(co-IP)
和定量蛋白质组学,以 HEK 293T 细胞作为阴性对照,证明了 alt-LAMA3、alt-TM9SF3、LOC728392 和 MAP3K4-AS1的富集与其亚细胞定位一致的蛋白复合物。例如,核仁 alt-LAMA3 富集了 PeBoW 复合物
(PES1、BOP1 和 WDR12)
,这与前核糖体 RNA 转录和加工有关,以及核糖体生物合成的蛋白质
(NOL9、NPM3)
相关。染色质相关的 alt-TM9SF3 与前 mRNA 剪接因子
(SRSF3、SRSF4 和 U2AF1)
相互作用,表明它可能参与共转录剪接。核膜相关 LOC728392 微生物蛋白与核输入蛋白
(LRRC59 和 KPNB1)
共免疫沉淀。核 MAP3K4-AS1 微蛋白富集了 MCM 复合物
(MCM2、MCM4、MCM5 和 MCM7)
和 PARP1,表明它可能在基因组复制和维持中发挥作用。作者对每个样本中前 50 种富集蛋白进行 Gene Ontology 分析,确定了与定位蛋白相关的细胞信号通路。
为了确定用 MicroID 鉴定的 alt-proteins的生物学重要性,研究人员对 alt-LAMA3 进行了分子表征。基于其 PeBoW 复合物关联,作者假设 alt-LAMA3 调节核糖体亚基合成。首先作者通过蛋白质印迹证实了内源性 alt-LAMA3 与 PeBoW 复合物成员的相互作用。然后并证实了PeBoW 复合物与 pre-rRNA 加工有关。同时研究人员检查了 alt-LAMA3 是否也会影响 rDNA 转录。利用双荧光素酶报告基因,研究人员观察到在没有 alt-LAMA3 的情况下 RNA 聚合酶 I
(RNAPI)
转录存在缺陷。
接下来,为了能够检测小鼠亚核结构中的microproteins 和 alt-proteins,研究人员应用腺相关病毒载体 AAV9递送了这些融合蛋白基因到C57BL/6J 小鼠中测试 MicroID技术。在基因递送和生物素给药后,收集肝脏、脾脏、肺、心脏和肾脏组织用于蛋白质印迹、免疫荧光和 LC-MS/MS。研究人员通过对 MicroID 标记的小鼠组织进行裂解、富集、蛋白质大小选择和 LC-MS/MS 蛋白质组学分析。在细胞核仁中鉴定出 87 种microproteins 和 alt-proteins,在整个细胞核中鉴定出 了96 种microproteins 和 alt-proteins。
综上,
研究人员开发了出了 MicroID,这是一种利用邻近生物素化标记鉴定培养细胞和动物体内亚细胞结构中未注释的microproteins 和 alt-proteins的技术。
研究人员对 80 种以前未报道的microproteins和 44 种alt-proteins的检测表明,生物素富集可以增强对全细胞小蛋白质组中难以检测的microproteins 和 alt-proteins的鉴定。因此,研究人员推测 MicroID 将可对标准蛋白质组学工作流程难以检测到的微蛋白和 alt 蛋白的鉴定上起着非常强大的作用,例如疏水性多肽,可能与内膜相关。未来, MicroID 可扩展到不同的细胞器
(包括膜结合和非膜结合)
以及不同的动物疾病模型,为更广泛地发现新的microproteins 和 alt-proteins奠定了基础。
Slavoff教授是本文的通讯作者,博士后那振坤
(Slavoff教授课题组)
和博士后代晓云
(陈斯迪教授课题组)
是本文的共同第一作者,该研究得到了Slavoff课题组,耶鲁大学陈斯迪课题组和耶鲁大学Baserga课题组其他成员的支持和帮助。
https://doi.org/10.1016/j.molcel.2022.06.035
制版人:十一
1. Prensner, J.R., Enache, O.M., Luria, V., Krug, K., Clauser, K.R., Dempster, J.M., Karger, A., Wang, L., Stumbraite, K., Wang, V.M., et al. (2021). Noncanonical open reading frames encode functional proteins essential for cancer cell survival. Nat Biotechnol 39, 697-704.
2. Polycarpou-Schwarz, M., Gross, M., Mestdagh, P., Schott, J., Grund, S.E., Hildenbrand, C., Rom, J., Aulmann, S., Sinn, H.P., Vandesompele, J., et al. (2018). The cancer-associated microprotein CASIMO1 controls cell proliferation and interacts with squalene epoxidase modulating lipid droplet formation. Oncogene 37, 4750-4768.
3. Huang, N., Li, F., Zhang, M., Zhou, H., Chen, Z., Ma, X., Yang, L., Wu, X., Zhong, J., Xiao, F., et al. (2021b). An Upstream Open Reading Frame in Phosphatase and Tensin Homolog Encodes a Circuit Breaker of Lactate Metabolism. Cell Metab 33, 128-144 e129.
4. Brunet, M.A., Jacques, J.F., Nassari, S., Tyzack, G.E., McGoldrick, P., Zinman, L., Jean, S., Robertson, J., Patani, R., and Roucou, X. (2021a). The FUS gene is dual-coding with both proteins contributing to FUS-mediated toxicity. EMBO Rep 22, e50640.
【非原创文章】本文著作权归文章作者所有,欢迎个人转发分享,未经作者的允许禁止转载,作者拥有所有法定权利,违者必究。