Title : Dissecting the role of the human microbiome in COVID-19 via metagenome-assembled genomes
Publish Date : 2022-09-06 00:00:00.0
Zotero Link: zotero://select/library/items/GFZU95UE

通过宏基因组组装的基因组剖析人类微生物组在 COVID-19 中的作用

2019 冠状病毒病 (COVID-19) 主要是一种由严重急性呼吸系统综合症冠状病毒 2 (SARS-CoV2) 感染引起的呼吸道疾病,通常伴有胃肠道症状。然而,人们对人类微生物组与 COVID-19 之间的关系知之甚少,这主要是因为大多数以前的研究都未能提供高分类分辨率来识别可能与 SARS-CoV-2 感染相互作用的微生物。在这里,我们使用全宏基因组鸟枪法测序数据以及组装和分箱策略,从六个独立队列中的 514 个 COVID-19 相关鼻咽和粪便样本中重建宏基因组组装基因组 (MAG)。.我们共重建了 11,584 个中高质量微生物 MAG,获得了 5403 个具有菌株级分辨率的非冗余 MAGs (nrMAG)。我们发现 COVID-19 患者肠道微生物组中许多物种的菌株丰富度显着降低。肠道微生物组特征可以准确区分 COVID-19 病例和健康对照,并预测 COVID-19 的进展。此外,我们确定了一组在 COVID-19 临床表现中具有假定因果作用的 nrMAGs,并揭示了它们可能与 SARS-CoV2 感染相互作用的功能途径。最后,我们证明我们研究的主要发现可以在三个独立的队列中得到很大程度上的验证。所呈现的结果强调了将人类肠道微生物组纳入我们对 SARS-CoV-2 感染和疾病进展的理解中的重要性。

2019 冠状病毒病 (COVID-19) 是一种由严重急性呼吸系统综合症冠状病毒 2 (SARS-CoV-2) 引起的呼吸道疾病,其持续的大流行已感染了全球数十亿人。COVID-19 的临床表现范围很广,包括无症状或轻度咳嗽和发热的疾病,以及伴有多器官衰竭的严重肺炎和导致死亡的急性呼吸窘迫综合征 (ARDS)。现有研究发现,很大一部分 COVID-19 患者至少有一种胃肠道 (GI) 症状2-5,例如腹泻、呕吐或腹痛。此外,据报道,在中国 73 名 SARS-CoV-2 感染住院患者中,53.4% 的患者在感染后第 1 天至第 12 天的粪便样本中检测出 SARS-CoV-2 阳性6。重要的是,在超过 20% 的感染患者中,即使在呼吸道和/或痰液样本未检测到病毒后,他们的粪便样本仍呈病毒阳性6。在某些情况下,粪便中的病毒载量甚至高于咽拭子中的病毒载量3。所有这些结果表明,胃肠道可能是 SARS-CoV-2 感染的重要肺外部位。目前,血管紧张素转换酶 2 (ACE2) 在 SARSCoV-2 通过其刺突蛋白侵入宿主细胞中的作用已得到充分证实7,并且 ACE2 在小肠和结肠中也高度表达。因此 ,长期存在大量粪便 SARS-CoV-2 RNA 病毒不太可能用吞咽喉中复制的病毒颗粒来解释,而是表明 SARS-CoV-2 肠道感染。

人类胃肠道是体内最大的免疫器官,在对病原感染或共生入侵的免疫反应中起着关键作用9。数万亿微生物生活在胃肠道内。这些微生物及其基因统称为人类肠道微生物组,可调节宿主免疫力。迄今为止,基于 16 S rRNA 基因测序的几项研究表明,COVID-19患者的人类上呼吸道和肠道微生物组发生了广泛变化。尽管 16 S rRNA 基因测序为人类微生物群的一般特征提供了有价值的见解,但它无法提供捕获足够序列变异以区分密切相关的分类群所需的分类分辨率。其他基于全宏基因组鸟枪法 (WMS) 测序的研究通过将短宏基因组读数映射到参考基因组数据库,探索了人类微生物组与 SARS-CoV-2 感染之间的联系。尽管 WMS 测序数据分析提供了比 16 S rRNA 基因测序数据分析更多的信息,但基于参考基因组数据库的现有研究受到这些数据库的局限性和偏差的影响,无法表征没有密切相关培养物代表的微生物。事实上,估计有 40-50% 的人类肠道物种缺乏参考基因组。这可能导致在表征肠道微生物群落时出现强烈的零偏倚。

分析 WMS 测序数据的另一种策略是通过从头组装和分箱重建宏基因组组装基因组 (MAG)。这种策略的一个关键优点是,它允许恢复尚未分离和培养的微生物的基因组,因此当前参考基因组数据库中没有这些微生物。该策略已在多项研究中采用,以提供对人类健康和疾病至关重要的微生物种群的基因组见解。
在这项研究中,我们应用了最先进的宏基因组组装和分箱策略,直接从 COVID-19 患者和对照的微生物组样本中重建微生物种群基因组(图 1)。我们的主要目标是构建与 COVID-19 相关的宏基因组基因组目录,以确定可能与 SARS-COV-2 感染的临床表现相关的新分类群和菌株水平差异。我们的结果表明,人类微生物组与 SARS-COV-2 感染之间的关联具有前所未有的高分类学分辨率。更重要的是,我们的研究为直接调查 COVID-19 相关微生物菌株的基因组内容提供了独特的资源,并为更有针对性的后续研究提供了启示。

Results

COVID-19 相关宏基因组数据集

为了通过 MAG 检查人类微生物组与 COVID19之间的关系,我们首先从 COVID19 项相关的人类微生物组研究(截至 2021 年 8 月公开)中收集 WMS 测序数据作为发现队列。我们从六个公开可用的数据集(图 1a 和表 1)中收集了 514 个微生物组样本 (n = 359 个体) 的原始 WMS 测序数据,这些数据集具有不同的技术设置 (例如,测序平台和测序深度),包括鼻咽 (n = 96) 和粪便微生物组 (n = 418) 样本。在发现队列的这些样本中,我们分别有 404 个 (78.60%) 和 110 个 (21.40%) 样本来自 COVID-19 患者和非 COVID-19 对照(图 2a)。

为了验证我们在发现队列中的主要发现,我们从三个公开可用的数据集(表 S1,截至 2022 年 4 月公开)中收集了 341 个粪便微生物组样本(n = 278 个个体)的原始 WMS 测序数据。在验证队列中,分别来自 COVID-19 患者和非 COVID-19 对照的 62.46% 和 37.54% 的微生物组样本。

图 1 研究的概念框架

图 1 研究的概念框架

  • a. 为了通过宏基因组组装基因组 (MAG) 了解人类微生物组与 COVID-19 之间的关系,我们分别收集了 514 个(6 个队列)和 341 个(3 个队列)鸟枪法宏基因组测序数据,分别用于发现和验证队列。这些微生物组样本包括来自 COVID-19 和非 COVID-19 对照的粪便和鼻咽样本。
  • b. 根据发现队列的宏基因组测序数据构建了总共 11,584 个 MAGs(≥50% 的完整性和 ≤5% 的污染)。重建的 MAGs 首先以 95% 的 ANI (平均核苷酸同一性) 聚集到 872 个物种水平的基因组 bin (SGB) 中。在基因组分类数据库 (GTDB) 中包含至少一个参考基因组(或宏基因组组装基因组)的 SGB 被认为是已知的 SGB。否则,它们被认为是未知的 SGB。然后根据 99% 的 ANI 将重建的 MAGs 去复制为 5403 个非冗余 MAGs (nrMAGs,菌株水平)。将 5403 个 nrMAGs 分为中等质量 MAGs (50% ≤完整性 < 90% 和 ≤5% 污染)和高质量 MAGs (≥90% 完整性和 ≤5% 污染)。
  • c 使用 PhyloPhlAn 构建 nrMAGs 的系统发育树。我们采用随机森林机器学习模型和 nrMAGs 来诊断 COVID-19 并预测 COVID-19 的进展(RT-qPCR 结果为阴性的日期)。通过 GMPT 管道鉴定 COVID-19 的允许性和保护性 nrMAGs。并使用 Prokka 和 MicrobeAnnotator 对允许和保护性 nrMAGs 的基因组进行功能注释。然后使用来自三个独立队列的数据验证发现队列的主要发现。

表 1 本研究中分析的人类宏基因组数据集的发现队列

表 1 本研究中分析的人类宏基因组数据集的发现队列

  • COVID-19 阴性样本是健康对照或 SARS-CoV-2 感染检测呈阴性的非 COVID-19 患者。

由发现队列构建的 COVID-19 的高质量微生物基因组目录

质量控制后,我们对来自发现队列的微生物组样本进行了宏基因组组装和分箱,总共回收了 12,195 个 MAG(图 1b)。为了标准化所有数据集的基因组质量,我们使用了 ≥50% 基因组完整性和 ≤5% 污染的阈值,结果为 11,584 个 MAGs [平均完整性 = 87.55%;平均污染 = 0.99%;平均基因组大小 = 2.6 兆碱基 (Mb);平均 N50 = 61.8 千克碱基 (kb),图 S1、S2]。这里 N50 是最短重叠群的序列长度,占基因组总长度的 50%。为了获得物种水平微生物群落的观点,我们首先将 11,584 个 MAG 组织到物种水平的基因组箱 (SGB) 中,ANI (平均核苷酸同一性) 阈值为 95%,总共得到 872 个 SGB,其中 160 个 (18.35%) SGB 代表基因组分类数据库 (GTDB) 中没有任何可用基因组的物种31,并被定义为未知的 SGB(uSGB, 图 S3)。为了评估最高质量的代表性基因组,我们以 99% 的 ANI 阈值去除了 11,584 个 MAGs,从而得到最终的 5403 个非冗余 MAGs(nrMAG),具有菌株水平分辨率 [平均完整性 = 86.87%;平均污染 = 0.99%;平均基因组大小 = 2.4 兆碱基 (Mb);平均 N50 = 63.2 千碱基 (kb),图 2d、e 和图 S2]。我们发现,与 COVID-19 微生物组样本相比,每个非 COVID-19 微生物组样本贡献的总 MAG 和 nrMAG 的比率相对较高,因为 21.40% 的非 COVID-19 微生物组样本贡献了 31.32% 的总 MAG 和 38.94% 的 nrMAG(图 2a-c 和图 S4)。

在这 5403 个菌株水平的 nrMAGs 中,2,190 个 (40.53%) nrMAGs 满足中等质量标准 (50% ≤完整性< 90% 和 ≤5% 污染),3,213 个 (59.47%) nrMAGs 显示高质量 (≥90% 完整性和 ≤5% 污染) (图 1)。使用基因组分类数据库,5,397 个 (99.89%) 和 6 个 (0.11%) nrMAG 分别被分配到细菌和古细菌结构域(图 S5)。nrMAGs 的门信息总结在图 2d 中。

图 2 从发现队列中 514 个 COVID-19 相关鸟枪法宏基因组测序数据中重建 MAGs

图 2 从发现队列中 514 个 COVID-19 相关鸟枪法宏基因组测序数据中重建 MAGs

  • a 不同数据集和疾病状态之间的样本分布。
  • b 从不同数据集和疾病状态中恢复的 MAG 数量。
  • c 从不同数据集和疾病状态中恢复的 nrMAG 数量。
  • d 使用 PhyloPhlAn 构建的 nrMAGs 的系统发育树。 外循环和分支的颜色代表门,周期内条形图代表所有微生物组样本的平均相对丰度。
  • e nrMAGs 上的完整性和污染分布以及点的颜色代表门。点的大小代表 nrMAGs 的基因组大小。

COVID-19 患者人类微生物组的改变

先前的研究表明,SARS-CoV-2 感染与属或种水平人类肠道和口腔 微生物组的 α 多样性有关。我们首先在我们的发现队列中调查了 SARS-CoV-2 感染是否与 nrMAG 水平人类微生物组的 α 多样性有关。比较了 COVID-19 患者和非 COVID-19 对照的 α 多样性测量(即丰富度和 Shannon 指数)(图 3a 和图 S6)。根据之前的研究,我们发现 COVID-19 患者肠道微生物组的丰富度和 Shannon 指数在两个数据集(Zuo 等人 18 和 Yeoh 等人 19,图 3a 和图 S6a、d)中显着低于非 COVID-19 对照组。有趣的是,在 COVID-19 和非 COVID-19 肺炎对照患者之间未发现显着结果(图 3a 和图 S6a)。与之前的研究一致36,我们发现 COVID-19 患者和非 COVID-19 对照在鼻咽微生物组样本中没有显着差异(图 3a 和图 S6e、f)这可能是由于样本量小以及非 COVID-19 对照不是鼻咽微生物组数据集之一的健康控制(Liu 等人36)。此外,在另一个鼻咽微生物组数据集 (PRJNA74398137) 中,我们只鉴定了少量的 nrMAGs,因为该数据集的大部分测序读数来自人类基因组。根据两个发现队列(即 Zuo 等人 18 和 Yeoh 等人 19),我们发现 COVID-19 患者肠道微生物组的 α 多样性总体上低于验证队列中非 COVID-19 对照的 α 多样性(图 S7)。

与之前的研究一致11,38,PCoA(主坐标分析)与 PERMANOVA(排列多变量方差分析)揭示了两个发现数据集(来自 Zuo 等人 18 和 Yeoh 等人 19)在 nrMAG 水平上 COVID-19 和非 COVID-19 对照患者的肠道微生物群落结构存在显着差异(图 3c、d 和图 S8)。在验证队列中也发现了类似的结果(图 S9a-c)。此外,这两个发现数据集中的 COVID-19 患者显示出比非 COVID-19 对照组更高的组内变异(图 3b)。这种模式在两个验证队列中得到证实 (Xu et al.39 and Li et al.22, Fig. S9e, f)。

在 Yeoh 等人 19 的数据集中,这些 COVID-19 患者的肠道微生物组样本是在鼻咽抽吸物或拭子检测呈 SARS-CoV-2 阴性之前和之后通过RT-qPCR收集的。此外,根据之前研究中报告的症状,COVID-19 患者被分为四个严重程度组(即轻度、中度、重度和危重)。我们发现,疾病严重程度较轻的 COVID-19 患者的肠道微生物组表现出显着较高的 Shannon 多样性(图 3e)。有趣的是,康复后 COVID-19 患者(通过 RT-qPCR 检测 SARS-CoV-2 阴性)的 nrMAG 组成与非 COVID-19 对照组与康复前 COVID19 患者(通过 RT-qPCR 检测 SARS-CoV-2 阳性,图 3f)的组成显著不同。与之前在代谢能力水平的研究一致,这些结果表明,COVID-19 患者的肠道微生物组在从 SARS-CoV-2 感染中恢复后并没有立即恢复到相对健康的状态。然后我们观察到 COVID-19 的疾病严重程度与 COVID-19 患者和非 COVID-19 对照之间的肠道微生物组差异显著呈正相关(图 3g)。为了了解 COVID-19 患者肠道微生物组的疾病严重程度与短期变化之间的关系,我们追踪了与疾病严重程度相关的每个人体内微生物组的变化。有趣的是,疾病严重程度较轻的 COVID-19 患者在肠道微生物组中表现出较低的时间变化(通过纵向微生物组样本的 Bray-Curtis 差异量化,图 3h)。在较轻的疾病严重程度组中,肠道微生物组样本的时间变化较低,部分原因是这些组中纵向微生物组样本中常见 nrMAG 的比例较高(图 3i)。

图 3 发现队列中人类微生物组的 COVID-19 相关改变

图 3 发现队列中人类微生物组的 COVID-19 相关改变

  • 每项研究的人类微生物组在 nrMAG 水平的 Shannon 多样性 (a) 和组内 Bray-Curtis 差异 (b)。每个面板的背景颜色 (a, b) 代表来自人类肠道(浅红色)或鼻咽部(浅绿色)的微生物组样本的来源。
  • 主坐标分析 (PCoA) 图基于 Zuo 等人 (c) 和 Yeoh 等人研究中微生物组成的 Bray-Curtis 不相似性。
  • (d)所有 PERMANOVA 检验均使用 9999 种基于 Bray-Curtis 双侧相异性的排列进行。
  • e 来自 Yeoh 等人的研究的不同疾病严重程度组的 Shannon 多样性。
  • f 健康对照者与 COVID-19 患者在鼻咽抽吸物或拭子检测出 SARS-CoV-2 阴性之前或之后的肠道微生物组箱形图 Bray-Curtis 差异来自 Yeoh 等人的研究。
  • g 来自 Yeoh 等人的研究的肠道微生物组 Bray-Curtis 患者与来自不同疾病严重程度组的 COVID-19 患者之间的 Bray-Curtis 差异。
  • h 来自不同疾病严重程度组的个体微生物组时间变化随时间变化的箱线图 来自 Yeoh 等人的研究。
  • i 来自 Yeoh 等人的研究的 COVID-19 患者随时间变化的常见 nrMAG 的比例。P 值通过双侧 Wilcoxon-Mann-Whitney 检验计算。显示带有中位数的箱线图;下铰链和上铰链对应于第一和第三个四分位数(第 25 个和第 75 个百分位数);上下须从铰链延伸到距铰链不超过 1.5* 四分位数范围的最大值和最小值;离群值由半透明圆圈绘制。

COVID-19 患者失去了许多多种微生物种类的菌株

为了探讨同一物种内的菌株水平多样性是否与 COVID-19 有关,我们分析了来自两个发现队列(Zuo 等人 18 和 Yeoh 等人 19)以及三个验证队列 (Zhang 等人 41、Xu 等人 39 和 Li 等人 22 )的数据。我们首先根据 GTDB 分类信息将所有 nrMAGs 分组到物种水平。对于每个物种,我们计算了所有微生物组样品的菌株丰富度(即其 nrMAG 的数量)。那些没有物种注释的 nrMAGs 和仅包含一个 nrMAGs 的物种被排除在外。有趣的是,菌株丰富度最高的前 30 种微生物物种在发现队列和验证队列之间高度重叠(图 4a、b、图 S10a-c、S11)。值得注意的是,我们发现与非 COVID-19 对照相比,COVID-19 患者的发现(图 4c、d)和验证队列(图 S10d-f)都丢失了许多微生物种类的许多菌株。此外,那些具有显著菌株损失的物种在发现队列之间高度重叠(图 S12a),包括 Bariatricus comes、Blautia_A obeum、Blautia_A wexlerae、Dorea formicigenerans、Faecalibacterium prausnitzii_D、Faecalibacterium sp900539945 和 Fusicatenibacter saccharivorans。重要的是,这些结果与 nrMAG 水平的 α 多样性分析高度一致,即 COVID-19 患者在发现队列中鉴定的 nrMAG 数量明显低于非 COVID-19 对照(即 Zuo 等人和 Yeoh 等人)。我们发现,在验证队列中也鉴定出一些在发现队列中具有高 COVID-19 相关菌株损失的微生物物种 (9/30) (图 S12c)。对于 Xu 等人 39 队列,来自 COVID-19 患者的几个物种显示出比非 COVID-19 对照明显更高的菌株数量。这可能是由于 COVID-19 患者(2020 年收集)和非 COVID-19 对照(2016 年收集)的微生物组样本未同时收集和测序。

接下来,我们使用 Yeoh 等人 19 的数据研究了与菌株多样性相关的疾病严重程度。我们发现 7 个物种的菌株丰富度与疾病严重程度呈正相关 (Spearman 相关系数≥ 0.9,补充数据 1),包括肠杆菌、Fournierella sp900543285、Hungatella effluvii、鼠李糖乳杆菌、Rumini 乳杆菌和唾液乳杆菌。此外,共有 222 种微生物物种的菌株丰富度与疾病严重程度呈负相关 (Spearman 相关系数≤ −0.9,补充数据 1),例如 Blautia_A obeum、Bariatricus comes、Blautia_A wexlerae 和 Faecalibacterium prausnitzii_D。

图 4 两个发现队列中微生物物种菌株丰富度的 COVID-19 相关变化

图 4 两个发现队列中微生物物种菌株丰富度的 COVID-19 相关变化

  • a、b 从 Zuo 等人(样本量 n = 65)和 Yeoh 等人(b 样本量 n = 274)的研究中确定的菌株丰富度最高的前 30 个物种(即 nrMAG 的数量)。
  • c、d 从 Zuo 等人 (c) 和 Yeoh 等人 (d) 的研究中确定的非 COVID-19(蓝色)和 COVID-19(红色)样本之间菌株丰富度变化最高的前 30 个物种。数据以平均值±平均值的标准误差表示。P 值通过双侧 Wilcoxon-Mann-Whitney 检验计算

nrMAGs 对 COVID-19 患者和非 COVID19 对照准确分类

先前的研究表明,使用属或种级分类学概况对 SARS-CoV-2 感染进行基于微生物组的分类具有诊断潜力。为了测试 nrMAG 水平的肠道微生物组成是否可以区分COVID19患者和非 COVID-19 对照,我们在两个数据集上构建了随机森林分类器(Zuo 等人18:50 名 COVID-19 患者和 15 名非 COVID-19 对照;和 Yeoh 等人 19:196 名 COVID19 患者和 78 名非 COVID-19 对照患者),分别。重要的是,该分析是通过 5 倍交叉验证进行的,并且数据被随机分为训练集和测试集 50 次。由于我们的类别不平衡,我们应用了两个指标来量化分类性能: AUROC (受试者工作特征曲线下面积) 和 AUPRC (精度-召回曲线下面积)。与 PCoA 分析一致(图 3c),使用 Zuo 等人 18 的数据,我们发现 nrMAGs 可以准确检测 COVID-19,平均 AUROC 和 AUPRC 值分别为 0.981 和 0.971(图 S13a)。

nrMAGs 准确预测 COVID-19 的进展

接下来,我们调查了 nrMAGs 与 COVID-19 进展之间的关联。为了探索这种关联,我们采用随机森林回归模型,使用 Yeoh 等人 19 的数据(来自 100 名 COVID-19 患者的 196 个微生物组样本,图 S17)预测阴性 RT-qPCR 结果的日期。回归任务以 5 倍交叉验证执行,然后我们将数据随机拆分 50 次。值得注意的是,这种方法表明 nrMAGs 可以很好地预测阴性 RT-qPCR 结果的日期 (Pearson 相关性 0.425,P 值 = 1e − 45,图 5a)。在前 30 名(基于均方误差的百分比增加)中,最重要的 nrMAG (图 5b),我们鉴定了多个物种,如弗氏柠檬酸杆菌、肠蝇杆菌 sp900543885、波氏柠檬酸杆菌、Distasonis 副拟杆菌和小微荣氏菌。值得注意的是,我们还发现了一些 nrMAG来自已知的机会性病原体,包括 MAG02074 (准克雷伯菌 43)、MAG03769 (肺炎克雷伯菌 44) 和MAG02080 (埃希氏菌 coli_D45)。

图 5 基于 nrMAG 的机器学习模型可预测 COVID-19 的进展

图 5 基于 nrMAG 的机器学习模型可预测 COVID-19 的进展

  • 随机森林回归模型上阴性 RT-qPCR 结果的真实日期和预测日期之间的 Pearson 相关系数。
  • b 与预测性能相关的前 30 个重要 nrMAG。每个特征在回归中的重要性通过均方误差增加百分比 (% IncMSE) 来量化。水平条的长度表示平均值 %IncMSE 值。竖条的颜色表示 nrMAGs 在科级别的分类信息。这些 nrMAGs 的系统发育树是使用 PhyloPhlAn 构建的。

识别 COVID-19 严重程度的推定、允许和保护性 nrMAG

为了进一步表征人类肠道微生物组与 COVID-19 之间的关系,我们应用了广义微生物-表型三角测量 (GMPT) 方法,超越了标准的关联分析46(图 6a)。由于疾病严重程度数据的可用性,我们首先将 Yeoh 等人 19 研究的参与者分为五个不同的疾病严重程度组(即非 COVID-19 健康对照、轻度、中度、重度和危重)。

图 6 GMPT 管道确定的 COVID-19 的允许性和保护性 nrMAGs

图 6 GMPT 管道确定的 COVID-19 的允许性和保护性 nrMAGs

  • a GMPT 管道的工作流程。来自 Yeoh 等人研究的微生物组样本根据疾病严重程度分为五组(即健康对照、轻度、中度、重度和危重)。对每种可能的成对比较进行差异丰度分析 (5 组之间的 10 次成对比较)。差异丰度 nrMAGs 库源自这些成对分析。差异丰度的 nrMAGs 根据它们在所有成对比较中出现的频率和可微性(降序)进行排名。我们进一步使用 nrMAGs 的平均相对丰度和疾病严重程度来计算 Spearman 相关系数。这里正(负)Spearman 相关系数 (ρ) 代表 COVID-19 严重程度的允许(保护性)nrMAG。与 0 的 spearman 相关性意味着 nrMAGs 可能对 SARS-CoV-2 感染的严重程度呈中性。
  • b 热图显示了使用 GMPT 确定的不同疾病严重程度组中允许、中性和保护性 nrMAG 的丰度分布。这些 nrMAGs 使用基于基因组分类数据库的 GTDB-Tk 进行分类注释。分类标签的颜色代表宽松、保护或中性 nrMAG。这些 nrMAGs 的系统发育树是使用 PhyloPhlAn 构建的。

基因组注释揭示了 COVID-19 的允许性和保护性 nrMAG 之间的功能差异

为了了解从 Yeoh 等人 19 的研究中鉴定出的那些允许和保护性的 nrMAG 如何与 SARS-CoV-2 感染相互作用,我们接下来研究了允许和保护性 nrMAG 的功能能力是否不同。为了实现这一目标,我们首先使用 Prokka50 注释了允许和保护性 nrMAGs 的基因组。然后,我们使用 MicrobeAnnotator51 处理翻译的编码序列进行功能注释,并计算 KEGG 模块完整性(参见方法)。在这里,KEGG 模块是功能性基因单元,与更高的代谢能力、结构复合物和表型特征有关。总共 231 个和 254 个 KEGG 模块分别被来自允许和保护性 nrMAG 的至少一个基因组覆盖。主成分分析显示,允许和保护性 nrMAG 之间的代谢潜力存在很大差异(图 7a,PERMANOVA:P 值 = 0.0001)。图 S19 总结了每个 nrMAG 的主要 KEGG 模块(至少具有 50% 的模块完整性)。值得注意的是,我们确定了一组 KEGG 模块,它们在宽容和保护 nrMAG 之间的模块完整性方面存在显着差异(图 7b)。例如,与保护性 nrMAG 相比,允许的 nrMAGs 在磷酸戊糖途径 (例如,M0004 和 M0006) 处显示出显着更高的完整性水平。此外,我们发现多个微生物基因组有可能使用这种途径(图 S20、21)。

图 7 COVID-19 的允许和保护性 nrMAG 的基因组注释。

图 7 COVID-19 的允许和保护性 nrMAG 的基因组注释。

  • 来自允许 (n = 8) 和保护性 (n = 63) nrMAG 的所有基因组的 KEGG 模块完整性的主成分分析 (PCA) 图。PERMANOVA 检验采用 9999 个双侧排列。
  • b 根据平均差对宽容 (n = 8) 和保护 (n = 63) nrMAG 之间的前 20 个差分 KEGG 模块进行排名。数据以平均值±平均值的标准误差表示。通过双侧 Wilcoxon-Mann-Whitney 检验计算 P值