Fold change

最后发布时间 : 2025-05-07 10:11:01 浏览量 :

mean(log2(condition1)) - mean(log2(condition2)) 与 log2(geo_mean(condition1)/geo_mean(condition2))的区别

这是一个非常经典的问题,涉及到对数空间中的平均几何平均数的数学性质。我们来一步步分析:

✅ 两者公式

1. 算术平均的差值(对数空间):

\text{diff}_1 = \text{mean}(\log_2(\text{condition1})) - \text{mean}(\log_2(\text{condition2}))

2. 对数的几何平均之比:

\text{diff}_2 = \log_2\left(\frac{\text{geo\_mean}(\text{condition1})}{\text{geo\_mean}(\text{condition2})}\right)

✅ 数学上,这两个是相等的

这是因为:

  • 几何平均的定义是:

\text{geo\_mean}(x_1, x_2, \dots, x_n) = \left(\prod_{i=1}^{n} x_i\right)^{1/n}

  • 而:

\log_2(\text{geo\_mean}(x)) = \frac{1}{n} \sum_{i=1}^{n} \log_2(x_i) = \text{mean}(\log_2(x))

因此:

\log_2\left(\frac{\text{geo\_mean}(A)}{\text{geo\_mean}(B)}\right) = \log_2(\text{geo\_mean}(A)) - \log_2(\text{geo\_mean}(B)) = \text{mean}(\log_2(A)) - \text{mean}(\log_2(B))

✅ 结论:

这两个公式 数学上完全等价,即:

\boxed{ \text{mean}(\log_2(A)) - \text{mean}(\log_2(B)) = \log_2\left(\frac{\text{geo\_mean}(A)}{\text{geo\_mean}(B)}\right) }

💡 小心点:

  • 前提是:对数是同底(log2),且数据必须都是正值(> 0)
  • 如果有零或负数,需要加 pseudocount 或过滤。