二代测序(Next-Generation Sequencing, NGS)得到的单菌基因组,要鉴定该基因组属于哪个物种,通常需要经过以下几个步骤:
首先,需要将二代测序得到的reads进行拼接组装,得到较完整的基因组序列。 常用的组装工具包括:
长于 500 bp 的肠球菌菌株的支架用 Prokka 注释,泛基因组由 roary(v.3.11.2) 计算,并由 anvio (v.6.2) 可视化。 (Yang 等, 2022, p. 572) (pdf)
可以使用自动注释工具识别基因、rRNA、tRNA等:
这一步有助于后续分析,比如功能注释和系统发育分析。
如果你只关心大致的分类(属、种级别):
最常用、推荐的方法。高分辨率,可精准到种级。
标准阈值:
比对你组装的基因组和数据库中已知物种基因组,得到 ANI 值。
这是一个目前非常主流的工具,用于系统发育定位和物种注释,适用于完整或接近完整的基因组。
官网: https://github.com/ecogenomics/gtdbtk
原始reads -> 组装(SPAdes) -> 基因组fasta文件 └─> 提取16S rRNA + BLAST(粗略鉴定) └─> GTDB-Tk or fastANI(高精度物种鉴定)