除了需要考虑计数数据的细节(例如非正态性和方差对平均值的依赖性)之外,一个核心挑战是典型 HTS 实验中的样品数量少——通常每个条件只有两到三个重复。由于组内方差估计的高度不确定性,单独处理每个基因的推理方法在这里缺乏效力。在高通量检测中,可以通过汇集跨基因的信息来克服这一限制,特别是通过利用关于同一实验中测量的不同基因方差相似性的假设。
DESeq2 默认会先估计 dispersion 参数,然后在 GLM 中结合估计的 dispersion 参数来计算基因表达差异的显著性。