中南大学王建新团队在罕见细胞识别研究中取得重要进展
来源:计算机学院 点击次数:次 发布时间:2024年09月06日 作者:——
本网讯 8月31日,国际权威期刊《自然·通讯》(Nature Communications)在线发表了中南大学计算机学院王建新教授团队的最新研究成果“scCAD:基于簇分解的异常检测方法用于单细胞表达数据中的罕见细胞识别(scCAD: Cluster decomposition-based anomaly detection for rare cell identification in single-cell expression data)”。该论文基于单细胞转录组测序数据提出了准确的罕见细胞识别算法,并开发了相应的软件scCAD。中南大学计算机学院徐云佩为论文第一作者,计算机学院王建新教授与李洪东副教授为论文共同通讯作者,中南大学为第一署名单位。
单细胞转录组测序(scRNA-seq)技术已经成为描绘复杂组织中细胞景观的关键工具。技术革新所带来的数据规模的增长有助于识别和分析在特定生物学或病理状态下扮演着重要角色的罕见细胞类型。准确识别这些罕见细胞对于全面理解组织功能和结构、揭示新的生物学现象或疾病机制至关重要。近年来,尽管提出了许多用于识别罕见细胞的方法,这些方法往往依赖于基于部分或整体基因表达的单次聚类结果,这可能导致罕见细胞被忽视,从而限制了其准确识别。此外,这些方法通常缺乏在广泛研究的不同组织和物种中的单细胞数据上的深入验证,未能充分证明其准确性和鲁棒性。为了更好地识别和理解罕见细胞,迫切需要发展更加精准和全面的识别方法。
针对这一局限,王建新团队通过深入分析罕见细胞在单细胞转录组测序数据中的特点,提出了一种基于聚类分解的异常检测算法,准确识别罕见细胞。在25个真实的单细胞转录组测序数据上对scCAD进行了基准测试,证明了与10种最先进的方法相比,它的性能优越。跨不同数据集(包括小鼠气道、大脑、肠道、人类胰腺、免疫学数据等)的深入案例研究展示了scCAD在复杂生物学场景中识别罕见细胞类型的有效性。特别是在透明细胞肾细胞癌的数据中,scCAD有效纠正了罕见细胞的注释错误,并识别了与疾病相关的免疫细胞亚型。Kaplan-Meier分析表明,所鉴定的罕见细胞簇中的差异表达基因与总生存期显著相关,提供了有价值的预后信息。
scCAD流程图
本研究受国家重点研发计划、国家自然科学基金、湘江实验室揭榜挂帅项目等多个项目支持。
(一审:唐潇珺 二审:韩艳 三审:李殷)