Gene Set Enrichment Analysis (GSEA)

最后发布时间:2022-04-14 11:40:00 浏览量:

Gene Set Enrichment Analysis (GSEA) is a computational method that determines whether an a priori defined set of genes shows statistically significant, concordant differences between two biological states

Gene Set Enrichment Analyses(GSEA, 基因集富集分析)

传统富集分析的不足

  • 输入基因列表的纳入标准是武断的(abs(LogFC)>1, FDR 小于 0.05 )
    • 可能排除了那些由于某种原因未能达到统计学意义的潜在的重要基因
  • 传统富集方法仅仅使用基因名进行富集,没有考虑基因的表达量
    • 每个基因被赋予同样的重要性
  • 传统富集方法假定基因与基因之间是相互独立的
    • 生物体内这个假设很多情况下不满足
    • 传统富集分析容易出现错误或假阳性结果

GSEA可以用于表达发生微弱变化的基因集

当差异基因数量很少,但是某些基因在某一些样品中(实验组或对照组)表达量明显偏低,并且可以重复,那么认为这些基因与表型是相关的。

图片alt

图片alt

GSEA原理

Gene set enrichment analysis: a knowledge-based approach for interpreting genome-wide expression profiles

GSEA 使用Kolmogorov Smirnof检验来寻找数据集整体分布中定义的非对称分布的数据集整体分布中的基因模块。
用热图展示Class A 与Class B 所有基因,如果基因集合(Gene Set1)与肿瘤的发生发展没有关系,基因集合的基因会随机的分布在整个列表当中(每一个箭头代表基因集合的基因),不会有任何倾向性。Gene Set2与Class A高表达基因相关,会倾向与富集在下方。
预先构建的基因集合与实验的基因比较,查看基因集中的基因是否富集在高表达基因中。

图片alt

图片alt

参考