学习资料
启动软件所在虚拟环境
# gtdbtk与drep安装在了同一个环境 # conda activate gtdbtk
细菌基因组物种注释
以上面鉴定的10个种为例,注意扩展名要与输入文件一致,可使用压缩格式gz。主要结果文件描述:此9个细菌基因组,结果位于tax.bac120开头的文件,如物种注释 tax.bac120.summary.tsv。古菌结果位于tax.ar122开头的文件中。
mkdir -p temp/gtdb_classify # 10个基因组,24p,100min 152 G内存 gtdbtk classify_wf \ --genome_dir temp/drep95/dereplicated_genomes \ --out_dir temp/gtdb_classify \ --extension fa \ --prefix tax \ --cpus 10
多序列对齐结果建树
# 以9个细菌基因组的120个单拷贝基因建树,1s mkdir -p temp/gtdb_infer gtdbtk infer \ --msa_file temp/gtdb_classify/tax.bac120.user_msa.fasta \ --out_dir temp/gtdb_infer \ --prefix tax \ --cpus 2
树文件可使用iTOL在线美化,也可使用GraphLan本地美化。
以gtdb-tk物种注释(tax.bac120.summary.tsv)和drep基因组评估(Widb.csv)信息为注释信息
mkdir -p result/itol # 制作分类学表 tail -n+2 temp/gtdb_classify/tax.bac120.summary.tsv|cut -f 1-2|sed 's/;/\t/g'|sed '1 s/^/ID\tDomain\tPhylum\tClass\tOrder\tFamily\tGenus\tSpecies\n/' \ > result/itol/tax.txt # 基因组评估信息 sed 's/,/\t/g;s/.fa//' temp/drep95/data_tables/Widb.csv|cut -f 1-7,11|sed '1 s/genome/ID/' \ > result/itol/genome.txt # 整合注释文件 awk 'BEGIN{OFS=FS="\t"} NR==FNR{a[$1]=$0} NR>FNR{print $0,a[$1]}' result/itol/genome.txt result/itol/tax.txt|cut -f 1-8,10- > result/itol/annotation.txt
table2itol制作注释文件
cd result/itol/ # 设置脚本位置 db=/disk1/db/script/table2itol/ #db=/db ## 方案1. 分类彩带、数值热图、种标签 # -a 找不到输入列将终止运行(默认不执行)-c 将整数列转换为factor或具有小数点的数字,-t 偏离提示标签时转换ID列,-w 颜色带,区域宽度等, -D输出目录,-i OTU列名,-l 种标签替换ID # Fatal error: ??????'./table2itol-master/table2itol.R': ????????? Rscript ${db}/table2itol.R -a -c double -D plan1 -i ID -l Species -t %s -w 0.5 annotation.txt # 生成注释文件中每列为单独一个文件 ## 方案2. 数值柱形图,树门背景色,属标签 Rscript ${db}/table2itol.R -a -d -c none -D plan2 -b Phylum -i ID -l Genus -t %s -w 0.5 annotation.txt ## 方案3.分类彩带、整数为柱、小数为热图 Rscript ${db}/table2itol.R -c keep -D plan3 -i ID -t %s annotation.txt ## 方案4. 将整数转化成因子生成注释文件 Rscript ${db}/table2itol.R -a -c factor -D plan4 -i ID -l Genus -t %s -w 0 annotation.txt
conda activate metawrap export PERL_5LIB=${PERL5LIB}:${soft}/envs/metawrap/lib/perl5/site_perl/5.22.0/ i=bin1 time prokka result/contig/${db}.fa \ --kingdom Archaea,Bacteria --cpus 9 \ --outdir temp/prokka/${db}