展开

组装结果功能注释

最后发布时间 : 2024-06-10 07:10:21 浏览量 :

学习资料

Trinotate 是一个全面的注释套件,设计用于模型或非模型生物的转录组,特别是从头组装的转录组的自动功能注释。Trinotate 利用多种不同的参考方法进行功能注释,包括对已知序列数据(BLAST +/SwissProt)进行同源性搜索,蛋白质结构域鉴定(HMMER/PFAM) ,蛋白质信号肽和跨膜结构域预测(signalP/tmHMM) ,并利用各种注释数据库(eggNOG/GO/Kegg 数据库)。所有来自转录本分析的功能注释数据集成到 SQLite 数据库中,该数据库允许快速有效地搜索与所需的科学假设相关的具有特定质量的术语,或者为转录组创建整个注释报告的方法。

Trinotate 包括 TrinotateWeb,它提供了一个本地驱动的基于 Web 的图形界面,用于导航转录组注释并使用 Trinity/RSEM/Bioiconductor 分析框架分析转录本表达和差异表达。

Sequence Databases Required

Trinotate 在很大程度上依赖于 SwissProt 和 Pfam,定制的蛋白质文件生成如下所述,专门用于 Trinotate。您可以通过运行这个 Trinotate 构建过程来获得蛋白质数据库文件。此步骤将下载几个数据资源,包括 swissprot、 pfam 和其他相关资源的最新版本,创建并填充 Trinotate 样板 sqlite 数据库(Trinotate.sqlite) ,并生成与 BLAST 一起使用的 uniprot_sprot.pep文件,以及用于 Pfam 搜索的Pfam-A.hmm.gz文件。像这样运行构建过程:

$TRINOTATE_HOME/Trinotate --create \
                          --db myTrinotate.sqlite \
                          --trinotate_data_dir /path/to/TRINOTATE_DATA_DIR \
                          --use_diamond
docker run --rm  -it \
    --user $(id -u):$(id -g) \
    -v $PWD:/data \
    -v /tmp:/tmp \
    -e TRINOTATE_HOME=/usr/local/src/Trinotate \
    -w $PWD \
    trinityrnaseq/trinotate bash

$TRINOTATE_HOME/Trinotate  --create \
                          --db /data/myTrinotate.sqlite \
                          --trinotate_data_dir /data/db  \
                          --use_diamond