学习资料

在流行病学中,孟德尔随机化(通常缩写为 MR)是一种使用测量的基因
变异来检查暴露结果的因果影响的方法。在关键假设(见下文)下,该设计减少了反向因果关系和混杂因素,而这些因素通常会严重阻碍或误导对流行病学研究结果的解释。

该研究设计于 1986 年首次提出,随后由 Gray 和 Wheatley描述为一种无需进行传统随机对照试验(流行病学中确定因果关系的标准)即可获得假定因果变量影响的无偏估计的方法。这些作者还创造了孟德尔随机化这一术语。

动机

流行病学的主要目的之一是确定健康结果和疾病的可改变原因,尤其是那些引起公共卫生关注的结果和疾病。为了确定改变某一特定特征(例如通过干预、治疗或政策变化)是否会对人群产生有益的影响,需要有确凿的证据证明该特征会导致感兴趣的结果。然而,许多观察性流行病学研究设计在辨别相关性和因果关系方面的能力有限——具体来说,某一特定特征是导致感兴趣的结果,只是与该结果相关(但不导致该结果),还是结果本身的结果。只有前者才会在公共卫生环境中有益,因为公共卫生环境的目的是改变该特征以减轻疾病负担。有许多流行病学研究设计旨在了解人群样本中特征之间的关系,每种设计在提供因果证据方面都有共同和独特的优势和局限性,其中“黄金标准”是随机对照试验。

众所周知,在不同设计的多项研究中,因果证据的一致性成功地得到了证明,包括吸烟与肺癌之间,以及血压与中风之间的因果关系。然而,也存在显著的失败,即一些被假设为某一特定结果的因果风险因素的暴露,后来被一些精心设计的随机对照试验证明并非因果关系。例如,以前人们认为激素替代疗法可以预防心血管疾病,但现在已知它并没有这种好处[5]另一个值得注意的例子是硒和前列腺癌。一些观察性研究发现,循环中硒水平较高(通常通过各种食物和膳食补充剂获得)与前列腺癌风险较低之间存在关联。然而,硒和维生素 E 癌症预防试验 (SELECT) 的证据表明,膳食中补充硒实际上会增加前列腺癌和晚期前列腺癌的风险,并且还有增加 2 型糖尿病风险的脱靶效应。孟德尔随机化方法现在支持这样的观点:高硒水平可能无法预防普通人群的癌症,甚至可能增加患特定类型癌症的风险。观察性流行病学研究与随机对照试验之间的这种不一致可能是许多观察性流行病学设计中的社会、行为或生理混杂因素的结果,这些因素特别难以准确测量和控制。此外,随机对照试验(RCT) 通常成本高昂、耗时费力,许多流行病学发现在临床试验中无法从伦理上复制。孟德尔随机化研究似乎能够比 RCT 更有效地解决潜在混杂问题。

定义

孟德尔随机化 (MR) 本质上是一种源自计量经济学的工具变量估计方法。该方法利用与假定暴露密切相关的种系遗传变异(通常以单核苷酸多态性或 SNP的形式)的特性作为该暴露的“代理”或“工具”,以测试和估计暴露对观察数据中感兴趣结果的因果影响。所使用的遗传变异要么对暴露模式产生众所周知的影响(例如大量吸烟的倾向),要么产生模仿可改变暴露产生的影响(例如,血液胆固醇升高)。重要的是,基因型必须仅通过其对感兴趣暴露的影响间接影响疾病状态。

由于基因型在减数分裂过程中从父母传递给后代时是随机分配的,因此由与人群暴露相关的遗传变异定义的个体群体应该与通常困扰观察性流行病学研究的混杂因素基本无关。种系遗传变异(即可遗传的)也在受孕时暂时固定,不会因任何结果或疾病的发生而改变,从而排除了反向因果关系。此外,鉴于现代基因分型技术的改进,遗传数据的测量误差和系统性错误分类通常较低。在这方面,孟德尔随机化可以被认为类似于“自然界的随机对照试验”。

孟德尔随机化需要三个核心工具变量假设。即:

为了确保第一个核心假设得到验证,孟德尔随机化要求遗传变异与感兴趣的暴露之间存在明显关联。这些关联通常来自全基因组关联研究,但也可以是候选基因研究。第二个假设依赖于不存在人口子结构(例如,导致基因型与结果之间关联的地理因素)、与基因型无关的配偶选择(即随机交配或随机交配)和没有王朝效应(即,父母基因型在父母表型中的表达直接影响后代表型)。

孟德尔随机化通过引入一个称之为工具变量的中间变量,来分析暴露因素和结局之间的因果关系,解决了传统实验方法由于混杂因素的存在,而无法有效说明暴露因素和结局变量之间因果性的问题。