首先这两款软件都是用于基于参考基因组的转录组组装,当然也可用于转录本的定量。前者于2016年的 protocol上发表的转录组流程HISAT, StringTie and Ballgown后被广泛使用,后者则是老牌的RNA分析软件了。在算法上来说Stringtie使用的是流神经网络算法,Cufflinks则是吝啬算法;从组装效果上来看Stringtie在灵敏度和准确度上表现较好,能够拼接出更完整、更准确的基因;从定量上来说,两者相差不大,但是cufflinks在一些特殊情况下会有异常的表达量;从运行速度上来说,Stringtie远远快了cufflinks了

默认用法的通用命令行具有此格式:

stringtie [-o <output.gtf>] [other_options] <read_alignments.bam>

该程序的主要输入(<read_alignments.bam>)必须是SAM,BAM或CRAM文件,带有RNA-seq读取对齐的基因组位置(例如,TopHat accessed_hits.bam Files由TopHat或之后的HISAT2输出产生的BAM文件。如下所述,使用samtools对其进行排序和转换)。

主要输出是一个GTF文件,其中包含由StringTieread alignment data组装的转录本的结构定义。输出文件的名称应使用-o选项指定。如果未使用此选项,则将带有组装成绩单的输出GTF记录打印到标准输出。注意:如果使用了--mix选项,StringTie期望将两个对齐文件作为位置参数给出,则以特定顺序:简短的读取对齐必须是第一个文件,而长读取对齐必须是第二个输入文件。两个对齐文件必须通过基因组位置进行排序。

 stringtie [-o <output.gtf>] --mix [other_options] <short_read_alns.bam> <long_read_alns.bam>

参考