(alternative splicing)转录组一般是指从细胞或组织的基因组所转录出来的RNA的总和,包括编码蛋白质的mRNA和各种非编码RNA(rRNA, tRNA, snRNA, snoRNA, lncRNA, microRNA等)。真核生物的基因结构是不连续的,如下图:
可变剪切(differential splicing)也叫做选择性剪切(alternative splicing,AS):指的是在 mRNA 前体到成熟 mRNA 的过程当中,不同的剪切方式使得同一个基因可以产生多个不同的成熟 mRNA,最终产生不同的蛋白质。可变剪切在真核生物体内广泛存在,有研究指出,对于人类基因组中包含多个exon 的基因而言,其中有 95%的基因都存在可变剪切现象。可变剪切导致了转录本和蛋白质结构与功能的多态性,是一种重要的转录调控机制。
可变剪切的形式复杂多样,大致可以分为5大类。
Modes of alternative splicing (AS) of pre-mRNA
比较旧的分析可变剪切的软件主要有SpliceR、SpliceGrapher、ASprofile以及Splicing Express等,它们是基于cufflinks软件的结果,将reads回帖到基因组序列后,根据位置和长度及结构信息,来确定或预测可能的剪切体的类型。目前主流已经不再使用tophat+cufflinks流程了。
比较新的几款软件:Multivariate Analysis of Transcript Splicing (MATS)IsoformSwitchAnalyzeR