NCBI Taxonomy数据库中的nucl_gb.accession2taxid.gz、nucl_wgs.accession2taxid.gz和taxdump.tar.gz文件在功能和内容上有以下区别:
总结表格
通过以上文件组合,可完成从序列比对到物种注释的全流程分析。
wget https://ftp.ncbi.nlm.nih.gov/genomes/refseq/bacteria/assembly_summary.txt
$ cat assembly_summary.txt | wc -l # 417112 $ du -sh assembly_summary.txt # 177M assembly_summary.txt
taxonomy中统计的细菌数
ftp ftp.ncbi.nlm.nih.gov
输入用户名 anonymous,密码留空或填写邮箱地址(如 user@example.com)完成匿名登录
ftp> cd genomes/refseq/bacteria