数据标准化的原因?

不同基因的长度不同
不同批次数据的测序量不同

图片alt

图片alt

ref:Computational methods for transcriptome annotation and quantification using RNA-seq

样本内标准化

RPM/CPM

RPKM/FPKM

在双端测序中:FPKM=RPKM/2

TPM

TPM强行要求基因最终加和相同,高表达基因会将整体的表达量拉高

样本间的标准化

直接计算比例

图片alt

图片alt

Quantile

图片alt

图片alt

REL(Relative Log Expression)

图片alt

图片alt


使用中位数进行最终标准化

TMM(Trimmed Mean of M-value)

基本统计学概念

标准差(Standard Deviation)

MetaboAnalyst标准化的方法包括

中位数相同

DEqMS蛋白数据差异分析
Use boxplot to check if the samples have medians centered. if not, do median centering.

生信小木屋

# Here the data is already median centered, we skip the following step. 
# dat.log = equalMedianNormalization(dat.log)

参考