知道了谁在那里(细菌鉴定),以及它们在那里干什么(功能探索)。接下来,我们需要进行微生物丰度的比较,找出特定疾病组织中显著变化的微生物,分析哪些微生物的丰度出现偏低或偏高的情况,确定可靠的微生物标志物,并进一步进行生物学验证。这其中,我们面临着诸多挑战:首先这些观察到的微生物丰度本质上是随机变量;其次微生物数据还存在零膨胀(Zero Inflation)和组成效应(Compositional Effects) 等问题,其中零膨胀是指数据集中出现过多零值的现象;组成效应是指数据总是加和为一个常数(通常为1或100%)。面对这些挑战,我们需要根据具体的生物学问题,采用统计建模的方法,准确合理的计算假设检验的p value,从而在数据分析上确定显著变化的微生物,为更深入的微生物与疾病关系的研究提供可靠的线索。