物种注释和进化树
最后发布时间 : 2023-08-06 23:36:13
浏览量 :
学习资料
4.3 GTDB-tk物种注释和进化树
启动软件所在虚拟环境
# gtdbtk与drep安装在了同一个环境
# conda activate gtdbtk
细菌基因组物种注释
以上面鉴定的10个种为例,注意扩展名要与输入文件一致,可使用压缩格式gz。主要结果文件描述:此9个细菌基因组,结果位于tax.bac120开头的文件,如物种注释 tax.bac120.summary.tsv。古菌结果位于tax.ar122开头的文件中。
mkdir -p temp/gtdb_classify
# 10个基因组,24p,100min 152 G内存
gtdbtk classify_wf \
--genome_dir temp/drep95/dereplicated_genomes \
--out_dir temp/gtdb_classify \
--extension fa \
--prefix tax \
--cpus 10
多序列对齐结果建树
# 以9个细菌基因组的120个单拷贝基因建树,1s
mkdir -p temp/gtdb_infer
gtdbtk infer \
--msa_file temp/gtdb_classify/tax.bac120.user_msa.fasta \
--out_dir temp/gtdb_infer \
--prefix tax \
--cpus 2
树文件可使用iTOL在线美化,也可使用GraphLan本地美化。
4.4 table2itol制作树注释文件
以gtdb-tk物种注释(tax.bac120.summary.tsv)和drep基因组评估(Widb.csv)信息为注释信息
mkdir -p result/itol
# 制作分类学表
tail -n+2 temp/gtdb_classify/tax.bac120.summary.tsv|cut -f 1-2|sed 's/;/\t/g'|sed '1 s/^/ID\tDomain\tPhylum\tClass\tOrder\tFamily\tGenus\tSpecies\n/' \
> result/itol/tax.txt
# 基因组评估信息
sed 's/,/\t/g;s/.fa//' temp/drep95/data_tables/Widb.csv|cut -f 1-7,11|sed '1 s/genome/ID/' \
> result/itol/genome.txt
# 整合注释文件
awk 'BEGIN{OFS=FS="\t"} NR==FNR{a[$1]=$0} NR>FNR{print $0,a[$1]}' result/itol/genome.txt result/itol/tax.txt|cut -f 1-8,10- > result/itol/annotation.txt
table2itol制作注释文件
cd result/itol/
# 设置脚本位置
db=/disk1/db/script/table2itol/
#db=/db
## 方案1. 分类彩带、数值热图、种标签
# -a 找不到输入列将终止运行(默认不执行)-c 将整数列转换为factor或具有小数点的数字,-t 偏离提示标签时转换ID列,-w 颜色带,区域宽度等, -D输出目录,-i OTU列名,-l 种标签替换ID
# Fatal error: ??????'./table2itol-master/table2itol.R': ?????????
Rscript ${db}/table2itol.R -a -c double -D plan1 -i ID -l Species -t %s -w 0.5 annotation.txt
# 生成注释文件中每列为单独一个文件
## 方案2. 数值柱形图,树门背景色,属标签
Rscript ${db}/table2itol.R -a -d -c none -D plan2 -b Phylum -i ID -l Genus -t %s -w 0.5 annotation.txt
## 方案3.分类彩带、整数为柱、小数为热图
Rscript ${db}/table2itol.R -c keep -D plan3 -i ID -t %s annotation.txt
## 方案4. 将整数转化成因子生成注释文件
Rscript ${db}/table2itol.R -a -c factor -D plan4 -i ID -l Genus -t %s -w 0 annotation.txt
4.5 PROKKA单菌基因组功能注释
conda activate metawrap
export PERL_5LIB=${PERL5LIB}:${soft}/envs/metawrap/lib/perl5/site_perl/5.22.0/
i=bin1
time prokka result/contig/${db}.fa \
--kingdom Archaea,Bacteria --cpus 9 \
--outdir temp/prokka/${db}