StringTie and Cufflinks transcript assembly and quantification for RNA-Seq
最后发布时间:2022-08-21 20:57:10
浏览量:
首先这两款软件都是用于基于参考基因组的转录组组装,当然也可用于转录本的定量。前者于2016年的 protocol上发表的转录组流程HISAT, StringTie and Ballgown后被广泛使用,后者则是老牌的RNA分析软件了。在算法上来说Stringtie使用的是流神经网络算法,Cufflinks则是吝啬算法;从组装效果上来看Stringtie在灵敏度和准确度上表现较好,能够拼接出更完整、更准确的基因;从定量上来说,两者相差不大,但是cufflinks在一些特殊情况下会有异常的表达量;从运行速度上来说,Stringtie远远快了cufflinks了
默认用法的通用命令行具有此格式:
stringtie [-o <output.gtf>] [other_options] <read_alignments.bam>
该程序的主要输入(<read_alignments.bam>)必须是SAM,BAM或CRAM文件,带有RNA-seq读取对齐的基因组位置(例如,TopHat accessed_hits.bam Files由TopHat或之后的HISAT2输出产生的BAM文件。如下所述,使用samtools对其进行排序和转换)。
主要输出是一个GTF文件,其中包含由StringTie
从read alignment data
组装的转录本的结构定义。输出文件的名称应使用-o
选项指定。如果未使用此选项,则将带有组装成绩单的输出GTF记录打印到标准输出。注意:如果使用了--mix
选项,StringTie期望将两个对齐文件作为位置参数给出,则以特定顺序:简短的读取对齐必须是第一个文件,而长读取对齐必须是第二个输入文件。两个对齐文件必须通过基因组位置进行排序。
stringtie [-o <output.gtf>] --mix [other_options] <short_read_alns.bam> <long_read_alns.bam>
参考
- https://www.bbsmax.com/A/WpdKV4xq5V/
- http://ccb.jhu.edu/software/stringtie/index.shtml
- https://blog.csdn.net/qq_27390023/article/details/120794753
- https://davetang.org/muse/2017/10/25/getting-started-hisat-stringtie-ballgown/
- https://github.com/c-kroeger/snakemake-hisat2-stringtie/blob/master/Snakefile