比较基因组



构建系统发育树(方法一 )

  • Mauve 进行排序,生成整齐的 scaffolds。
  • 将排序后的 genome 输入给 Roary / Panaroo 做核心基因比对。
  • 导出核心基因比对文件。
  • 用 FastTree / IQ-TREE 构建系统发育树。

构建系统发育树(方法二)

参考:Genome annotation and Pangenome analysis

Static Badge

  • 使用Prokka对Scaffolds注释得到gff文件
  • 使用Roary进行泛基因组分析得到core gene alignment文件
  • FastTree输入比对的文件,生成系统发育树

长于 500 bp 的肠球菌菌株的Scaffolds用 Prokka 注释,泛基因组由 roary(v.3.11.2) 计算,并由 anvio (v.6.2) 可视化。 (Yang 等, 2022, p. 572) (pdf)

变异检出和等位基因频率推断

  • EGF1-FE1 的封闭基因组被用作所有 NZW × BXSB F1 衍生分离株的参考序列。对于实验进化的 E. gallinarum 分离株或种群,使用 EGF1-FE4 作为参考基因组。罗伊氏乳杆菌和脆弱双歧杆菌亲本菌株的基因组草案分别用作进化的罗伊氏乳杆菌和脆弱芽孢杆菌分离株的参考序列。在作对之前,如上所述,使用 FastQC 和 Trimmomatic 对原始 Illumina 读数进行质量控制检查、修剪和过滤。使用 Snippy (v.4.4.3) 和 Breseq (v.0.35.5) 进行基于参考的比对,以检测 SNV、插入缺失和结构变异。对于单分离基因分型,应用 Breseq 的共有模式和 Snippy 的 snippy-multi。对于宏基因组,使用 Breseq 的多态性模式。每个宏基因组样品的读数都超过 300× 覆盖深度。EGF1-FE4 的基因组是在读取比对后使用 Breseq 的 gdtools APPLY 函数生成的

构建系统发育树(Phylogenetic tree)

  • 在 Harvest suite(v.1.1.2) 中,根据 Parsnp 的核心基因组比对构建了E. gallinarum ATCC、DSM 和 NZW × BXSB F1 衍生菌株的系统发育树。修剪的原始读长由 SPAdes(v.3.13.1) 组装为支架。然后,Mauve (v.2.3.1) 根据参考基因组 EGF1-FE1 对支架进行重新排序。Parsnp 将有序的基因组草稿用作核心基因组比对的输入。对于本研究中的其他系统发育树,使用了基于参考的比对与最大似然树构建方法SnippyBreseq 调用的 SNV 用于 UGENE (v.1.32.0) 中的树生成。替换模型设置为 GTR,所有其他设置均为默认值。所有树木都在 iTOL 中可视化。 (Yang 等, 2022, p. 572) (pdf)