单细胞+WGCNA+机器学习+pcr验证
单细胞测序分析和多机器学习方法鉴定 G0s2和 HPSE 为腹主动脉瘤的新生物标志物[1]
研究概述:
识别腹主动脉瘤(AAA)的生物标志物是了解其发病机制、开发新的靶向治疗方法,可能改善患者的预后和破裂风险的关键环节。本研究采用单细胞RNA测序、加权共表达网络(WGCNA)和差异表达分析从公共数据库中鉴定出AAA生物标志物,使用多种机器算法来识别多种生物标志物,并使用不同的GEO数据集进行验证。随后,鉴定出其中的DEGs,并对其进行分析发现G0S2可能是AAA的有效诊断生物标志物,HPSE也可用于诊断大型AAA的破裂风险,最后该研究还发现,免疫细胞在AAA的发生和进展中发挥作用,有可能提高其诊断和治疗。[2]
研究结果
单细胞数据质控和降维聚类以及差异基因和拟时间分析
将数据进行质量控制后,采用降维分析及聚类分析发现,AAA数据集细胞可分为20个聚类,包括B细胞、内皮细胞、成纤维细胞等等(图2A-C)
识别AAA细胞和正常细胞之间存在显著差异的基因,并进行细胞轨迹分化发现,AAA单核细胞的分化时间早于正常单核细胞。所有分析的细胞都为单核细胞(图3A-D)
加权共表达式网络分析
使用“flashClust”工具包进行聚类分析,构建无标度网络,使用不同的阈值参数进行筛选,最后生成7个模块,每个模块都包含具有相似共表达特征的基因,多个模块与AAA相关。(图4A-E)
GSE57691的差异基因分析
在该数据集中鉴定出288个差异表达基因(DEGs),并且,在大、小AAA样本中鉴定出了17个DEGs(图5A-D)。
GO分析显示功能被分为三类:生物过程、细胞成分和分子功能。对于AAA和正常样本,DEGs在生物过程中富集;KEGG通路富集于病毒蛋白与细胞因子和细胞因子受体相互作用、细胞因子受体相互作用等途径(图6A-B)
对于大、小AAA样本,DEGs在生物过程中富集,如血管伤口愈合和参与伤口愈合的血管生成等;KEGG通路在坏死、囊泡运输中的陷阱相互作用方面等途径被富集。(图6C-D)
AAA中G0S2的鉴定
整合数据集及WGCNA分识别的DEGs,发现G0S2为一个关键基因,提示该基因可能参与了AAA的发生发展,进一步再另两个数据集中检测到AAA样本中G0S2显著升高。ROC曲线也提示,G0S2可能是AAA的有效诊断生物标志物(图7A-E)
对GSE7284中G0S2的含量进行检测发现,G0S2在AAA样本中显著上调,并且ROC分析得到的AUC为0.911。(图7F-G)
扩张型AAA中生物标志物的鉴定
使用套索logistic回归从DEGs中识别出了12个关键的生物标志物;SVM-RFE方法鉴定出17个基因作为DEGs的重要生物标志物;此外,RF算法确定了两个基因作为关键指标,这三种方法都鉴定出了重叠的基因,一个上调(OSM),一个下调(HPSE)(图8A-D)。
芯片数据显示,HPSE在GSE98278的小AAA样本中高度上调,GSE57691的AUC为0.669,GSE98278数据集的AUC为0.754(图8E-I)
免疫细胞浸润结果
使用CIBERSORT排序算法总结了10个正常样本和49个AAA样本的结果,22个免疫细胞的相关热图显示显著正相关。(图9A-B)
AAA样本中Tfh细胞的比例一般高于正常样本,20个小AAA样本和29个大AAA样本的结果如图(图9C-D)
相关热图显示,AAA样品中Tfh细胞的比例较高,但M1和M2巨噬细胞的比例相对较低。(图9E-F)
生物标志物和免疫细胞
以上分析显示,G0S2与中性粒细胞等免疫细胞成正相关,但与静息肥大细胞等呈负相关(图10A)。
在大、小AAA样本中,HPSE与M0巨噬细胞、活化肥大细胞等呈正相关,但与M1巨噬细胞、静息肥大细胞等呈负相关(图10B)
诊断标记物的验证
使用qRT-PCR检测3个正常样本,3个小AAA样本和3个大AAA样本中两个生物标志物的表达水平,G0S2在AAA组织中表达显著上调,HPSE在小的AAA样本中显示出显著的上调(图11)
研究总结
本文通过单细胞、WGCNA、差异表达分析和结合多种机器学习方法确定了G0S2是一种新的AAA生物标志物,而HPSE是大型AAA的保护性生物标志物,这两个生物标志物使用额外的GEO数据进行了验证。此外,免疫浸润分析显示,Tfh细胞在AAA的进展中起着重要作用。因此,该研究结果可能为未来诊断和治疗AAA和延迟AAA患者的扩张提供了一个新的参考靶点。