
细胞命运由细胞内分子调控网络和细胞外微环境共同决定。单细胞组学技术可以测量细胞内的分子表达谱,但损失了空间位置信息。近年来,空间组学技术(Spatial Omics)的快速发展,使得实验人员可以在测量丰富的分子表达谱之外,额外获得空间位置信息,为解析组织微环境提供了条件。
主流空间组学技术包含空间转录组、空间蛋白质组、空间代谢组等。随着技术的发展,大量的空间组学数据快速产生,并存储在各种异构数据平台中。在具体数据分析之前,研究者首先必须下载原始数据,然后将其正确处理为标准格式,这通常费时费力。另一个问题是数据量,因为目前一些先进实验技术提供大视野和高空间分辨率
(例如Stereo-seq、MERFISH等)
,处理这些数据需要大量内存和时间消耗。
2023年2月16日,复旦大学类脑人工智能科学与技术研究院原致远与德州大学达拉斯分校张奇伟教授、腾讯AI Lab姚建华博士合作在Nature Methods上发表了文章
SODB facilitates comprehensive exploration of spatial omics data
(SODB促进空间组学数据的全面探索)
,给出了解决方案,支持用户快速浏览、可视化、读取、处理感兴趣的数据。
该数据库提供了来自26种空间组学技术,数据量超过5000万细胞
(spot)
,所有数据均由标准流程处理为Anndata形式,可兼容SCANPY、Squidpy等多种分析软件。SODB还提供了多种数据分析和可视化模块,包括基因空间表达、细胞类型注释、基因表达比较、SOView可视化分析等
(图2)
。此外,还提供了配套Python工具包pysodb,仅用一行代码可以方便的读取数据,相比传统数据处理和读取方式,带来时间效率和内存效率的提升。以Slide-seq数据为例,时间效率提升160倍
(传统方法读取需要19.04分钟,pysodb仅需7.16秒)
;内存效率提升549倍
(传统方法需要21.97GB,pysodb仅需0.04GB峰值内存)
。

目前,数据开放给所有人,通过网站[https://gene.ai.tencent.com/SpatialOmics/]或者Python包[https://github.com/TencentAILabHealthcare/pysodb]来访问数据。
本课题共同通讯作者是复旦大学类脑人工智能科学与技术研究院原致远
(兼第一作者)
、腾讯AI Lab姚建华博士、德州大学达拉斯分校张奇伟教授;清华深研院潘文韬为本文共同第一作者;中科院计算所赵屹教授、清华深研院李秀教授、腾讯AI Lab赵轩、许志梦等合作者为本课题做出重大贡献。
原文链接:
https://doi.org/10.1038/s41592-023-01773-7
制版人:十一
【非原创文章】本文著作权归文章作者所有,欢迎个人转发分享,未经作者的允许禁止转载,作者拥有所有法定权利,违者必究。
