Branch expression analysis modeling

最后发布时间:2022-07-22 11:35:12 浏览量:

Monocle 2 的主要工作是使细胞按照生物过程的进展进行排序。一旦对细胞进行排序后，就可以分析这些细胞，找到随着细胞进展而变化的基因。Monocle 2为每一个细胞分配一个pseudotime的值，它记录了细胞的进展。
为找的找到随着细胞进展而变化的基因，Monocle 2使用R package VGAM将基因的表达水平建模为一个平滑的、非线性吃的pseudotime function。

diff_test_res <- differentialGeneTest(cds_subset, fullModelFormulaStr = "~sm.ns(Pseudotime)")

sm.ns指出monocle应该通过基因表达拟合一个natural spline

Branch expression analysis modeling (BEAM) 是一个新的test方法对于分析特殊分支的点，BEAM可以报告分支相关的基因。
在Monocle 2 中将为每个细胞分配：

a pseudotime value
a "State" encoding the segment of the trajectory it resides upon based on a trajectory learning algorithm（根据轨迹学习算法编码其所在的轨迹段）

作者开发了BEAM去test依赖分支的基因表达，通过将问题表述为两个negative binomial GLMs之间的比。
测试的空模型(null model)假设被测试的基因不是分支特异性基因:

$expression \sim sm.ns(Pseudotime)$

然而，替代模型(alternative model)假设该基因是一个分支特异性基因，表示分支和转换伪时间之间的交互项。

$expression \sim sm.ns(Pseudotime)+Branch+sm.ns(Pseudotime):Branch$

每个模型都包括一个natural spline(这里有三个自由度) ，描述了作为pseudotime函数的平均expression的平滑变化。null model仅拟合单个曲线，alternative model为每个分支拟合不同的曲线。

在Monocle 2中依赖R package VGAM中的"smart" spline拟合功能，因此使用的是sm.ns()函数，而不是R package splines中的ns()

使用VGAM中的lrtest()函数执行likelihood ratio testing，类似于Monocle中的其它差异表达test。

显著的分支依赖基因(significant branch-dependent genes)，意味着这个基因沿着每个分支具有不同的表达动力学dynamics,具有不同形状的平滑曲线。

为了拟合完整的模型，必须将每个cell分配给适当的分支，该分支通过上述模型公式中的factor“Branch”进行编码。

Monocle的test分支的函数接受一个参数，制定比较那些分支。

: admin
: 联系作者

快捷入口: 生物信息学笔记思维导图浏览PDF 下载PDF

分享到：

标签

Github开源生信云平台 DEMO