展开

可变剪切分析

最后发布时间 : 2023-02-11 14:21:26 浏览量 :

背景知识

(alternative splicing)
转录组一般是指从细胞或组织的基因组所转录出来的RNA的总和,包括编码蛋白质的mRNA和各种非编码RNA(rRNA, tRNA, snRNA, snoRNA, lncRNA, microRNA等)。真核生物的基因结构是不连续的,如下图:

生信小木屋

其基因组最初的转录产物其实并不是成熟的mRNA分子,而是它的前体pre-mRNA,那么怎么变成成熟的mRNA呢,就需要从pre-mRNA中将非编码蛋白质的内含子(intron)切除,然后拼接剩下的编码蛋白质的外显子(exon)。但实际上,在这个过程中,有多种多样的前切和拼接方式,从而产生不同的剪切异构体,也就咱们要说的可变剪切。

可变剪切(differential splicing)也叫做选择性剪切(alternative splicing,AS):指的是在 mRNA 前体到成熟 mRNA 的过程当中,不同的剪切方式使得同一个基因可以产生多个不同的成熟 mRNA,最终产生不同的蛋白质。可变剪切在真核生物体内广泛存在,有研究指出,对于人类基因组中包含多个exon 的基因而言,其中有 95%的基因都存在可变剪切现象。可变剪切导致了转录本和蛋白质结构与功能的多态性,是一种重要的转录调控机制。

可变剪切的形式复杂多样,大致可以分为5大类。

  • 外显子跳跃(Exon skipping):哺乳动物细胞中最常见的AS类型,其中一个外显子被完全跳过。
  • 互斥外显子(Mutually exclusive exons):只有两个外显子中的一个被去除,但不是两个都被去除。
  • 可变5’供体或3’受体端剪切(Alternative donor (5′) or acceptor (3′) site):AS使用不同的5′或3′拼接点。
  • 内含子保留(Intron retention):mRNA中包含内含子。
  • 转录起始区域可变剪切(Alternate promoters):不同的启动子用于不同的剪接变体,导致mRNA转录的不同起始。
  • 转录终止区域可变剪切(Alternative polyadenylation sites):基于多聚腺苷酸化位点的识别,不同的外显子被剪接,导致转录物3′端的不同外显子。

生信小木屋

Modes of alternative splicing (AS) of pre-mRNA

软件算法

比较旧的分析可变剪切的软件主要有SpliceR、SpliceGrapher、ASprofile以及Splicing Express等,它们是基于cufflinks软件的结果,将reads回帖到基因组序列后,根据位置和长度及结构信息,来确定或预测可能的剪切体的类型。目前主流已经不再使用tophat+cufflinks流程了。

比较新的几款软件:
Multivariate Analysis of Transcript Splicing (MATS)
IsoformSwitchAnalyzeR