摘要近年来,空间转录组学发展十分迅速。在传统转录组测序的基础上,空间组学赋予细胞空间位置信息,揭示不同细胞类型之间的相互作用,广泛应用于在物种发育、脑科学和肿瘤药物研究等方面。在空间组学下游生物学功能分析之前,结合坐标信息和基因表达量来对组学数据处理的工作非常重要,是帮助发现生物学意义的保障。随着空间检测分辨率的提升,同时带来海量数据的存储和应用的挑战,针对上述挑战,本研究提出空间组学数据存储及原位呈现自动化流程。<br> 针对于空间组数据存储问题,搭建空间组学数据存储自动化流程,在空间组学数据不使用时,采用存储格式优化算法保存数据,数据使用时,采用分析格式优化算法将数据转化为空间组常用数据格式AnnData,用于后续空间组学分析。在结果测试的六张鼠脑切片中,通过和目前空间组学数据存储方式gzip、bzip2等比较,bzip2的平均压缩率为80.38%,gzip的平均压缩率为71.62%,而本自动化流程的平均压缩率为82.69%,结果显示本存储自动化流程的压缩率更高,更能节省存储空间。<br> 针对于空间组切片区域和细胞类型在二维空间难以原位观察以及细胞边界难以识别和分割等问题,搭建空间组学数据原位呈现自动化流程,详细介绍自动化流程的整体设计和各部分的具体实现,主要包括区域上色算法、细胞边界识别和分割算法和细胞聚类结果上色算法。在区域上色方面,读取空间组数据RNA长矩阵生成RNA灰度图,经过预处理、上色方案、评估方案等步骤,选择合适的区域上色方案对RNA灰度图进行上色。在细胞边界识别分割方面,对染色影像数据选择深度学习算法细胞边界识别和分割,对RNA长矩阵选择独创算法IcellSeg算法细胞边界识别和分割,然后对识别细胞后的染色影像和RNA长矩阵重合处理,生成带有细胞标签的RNA长矩阵用于空间组聚类分析。在细胞聚类结果上色方面,读取细胞聚类结果,经过预处理,上色方案、评估方案等步骤,选择合适的细胞类型上色方案对每一个细胞类型上色。<br> 通过和其他算法比较,结果显示空间组学数据原位呈现自动化流程三大算法在组学分析中具有优势。在区域上色方面,在结果测试的鼠脑切片T285、T319和T329中,通过和Seurat方法、四色原理上色等比较,平均而言,三张芯片中本算法的领域色差和比分水岭算法和深度学习算法的领域色差和大13.6%和10.32%,领域色差和越大,则说明可视化效果越好;结果显示本算法在空间组切片中上色可视化效果好,切片中各区域区分度高。在细胞边界识别和分割方面,在结果测试的鼠脑切片T285、T319和T329中,通过和分水岭算法、深度学习算法cellPose比较,平均而言,三张芯片中本算法细胞识别的数目比分水岭算法和深度学习算法识别多19.58%和28.74%,结果显示,本算法识别的细胞数目多于分水岭算法和cellPose算法,且在密集区域细胞识别效果好于二者。在细胞聚类结果上色方面,在结果测试数据集胚胎、小鼠嗅球和鼠脑中,通过和Seurat方法、随机上色算法进行比较,平均而言,三张芯片中本算法的LAB色差和比随机上色和Seurat方法上色识的大31.27%和22.87%,聚类结果LAB色差和越大,则说明可视化效果越好;结果说明本算法对细胞聚类结果上色,使得相邻细胞在组织上的可视化效果好,肉眼可见程度更高。<br> 综上,本研究开发了空间组学数据存储自动化流程和空间组学数据原位呈现自动化流程。与目前相应单细胞空间组数据分析方法比较,本研究开发的各个算法均具有优势,为空间组数据的存储与应用提供了有力工具。
更多相关知识
- 浏览0
- 被引0
- 下载0

相似文献
- 中文期刊
- 外文期刊
- 学位论文
- 会议论文


换一批



