Microarray和RNA-Seq数据的线性模型用户指南

1 介绍

2 先决条件

limma软件包本身可以被引用为:(2015)limma为RNA测序和微阵列研究提供差异表达分析
上面的文章回顾了limma包的整体功能,包括新的和旧的。

其他文章描述了软件包特定功能背后的统计方法。

如果使用limma进行差异表达分析,请引用:
(2016)稳健的高参数估计可以防止高变基因,提高检测差异表达的能力,本文描述了由lmFit实现的线性建模方法,以及由eBayes、topTable等实现的经验Bayes统计。它特别描述了eBayes的robust=TRUE或trend=TRUE。

如果您使用limma进行RNA序列分析,请引用:
(2014)Voom:用于RNA序列读取计数的精确权重解锁线性模型分析工具,该文章描述了RNA seq的voom和limma趋势管道。
为什么是权重?对样本和观测水平的变异性进行建模可以提高RNA序列分析的能力。,描述了描述了voomWithQualityWeights函数。

3 快速开始

4 读取微阵列数据

5 质量评估

6 Two-Color Data预处理

7 过滤未表达的探针

8 线性模型概述

10 Single-Channel实验设计

11 Two-Color的实验有一个共同的参考

12 直接Two-Color实验设计

13 Two-Color数据的分离通道分析

14 差异表达统计

15 矩阵质量权重

16 RNA-Seq数据

介绍

voom: Precision weights unlock linear model analysis tools for RNA-seq read countsWhy weight? Modelling sample and observational level variability improves power in RNA-seq analyses解释了RNA-seq的limma方法。

RNA-seq analysis is easy as 1-2-3 with limma, Glimma and edgeR给出了完整的工作流案例研究。

在RNA-seq的limma方法中,read counts被转换为log2-counts-per-million (logCPM),均值-方差关系通过精确权重(precision weights)或经验贝叶斯先验趋势(empirical Bayes prior trend)建模。精确权重(precision weights )法被称为“voom”,之前的趋势(empirical Bayes prior trend)法被称为“limma-trend”[15]。无论哪种情况,RNA序列数据都可以像微阵列数据一样进行分析。这意味着limma包中的任何线性建模或基因集测试方法都可以应用于RNA-seq数据。

制造一个表达矩阵

RNA-seq数据通常以unaligned reads的FastQ或BAM文件的形式呈现。reads需要被映射到参考基因组或转录组,然后在外显子或基因水平上产生表达矩阵。我们发现Rsubread package在这方面非常方便、快速和有效。其他流行的方法包括RSEM和HTseq。下面提供了一个可运行的示例,其中完整的代码展示了如何将Rsubread与limma一起使用。http://bioinf.wehi.edu.au/RNAseqCaseStudy。Chen等人[6]提供了另一个完整的代码示例

17 Two-Color案例研究

18 Single-Channel案例研究

19 RNA-Seq案例研究

参考