Gene Set Enrichment Analysis
(GSEA) is a computational method that determines whether an a priori defined set of genes
shows statistically significant, concordant differences between two biological states
传统富集分析的不足
当差异基因数量很少,但是某些基因在某一些样品中(实验组或对照组)表达量明显偏低,并且可以重复,那么认为这些基因与表型是相关的。
GSEA 使用Kolmogorov Smirnof检验来寻找数据集整体分布中定义的非对称分布的数据集整体分布中的基因模块。
用热图展示Class A 与Class B 所有基因,如果基因集合(Gene Set1)与肿瘤的发生发展没有关系,基因集合的基因会随机的分布在整个列表当中(每一个箭头代表基因集合的基因),不会有任何倾向性。Gene Set2与Class A高表达基因相关,会倾向与富集在下方。
预先构建的基因集合与实验的基因比较,查看基因集中的基因是否富集在高表达基因中。