

本文最初发布于 The Conversation。
我们大多数人都听过“相关性不等于因果关系”这句话。但要理解科学家们如何超越识别相关性来确定因果关系,对许多人来说仍然是个谜。
找出某个特定结果的原因,通常是科学研究的首要目标,尤其是在与健康相关的研究中。
我们想知道某个因素——比如喝葡萄酒或吃巧克力——是否会导致更好的或更差的健康结果。这样,我们就能在健康方面做出更明智的决定。
但是,科学家们究竟是如何得出这些答案的呢?
相关性与因果关系:基础知识
很容易找到相关性的例子,即两个变量有关联,但没有因果关系。例如,巧克力消费量与一些国家的人均诺贝尔奖获得者数量之间存在相关性。
吃巧克力会让人获得诺贝尔奖吗?当然不是。
这种相关性可能存在,因为巧克力消费量是财富的代理指标。而财富又与教育机会和高质量研究的资金有关,这些研究可能带来诺贝尔奖。
仅仅找到两件事之间的联系是不够的。在我们可以开始假设因果关系之前,科学家们需要更多的证据。
建立证据链
在化学或物理学中,通常可以在高度控制的条件下进行实验,以了解 X 如何影响 Y。但对于人类生物学来说,情况很少如此简单。
在大多数情况下,要确定因果关系,我们使用间接证据(稍后会详细介绍)。这需要一种称为归纳推理的方法——科学家们根据现有证据进行概括。
这有点像检察官如何根据间接证据来构建刑事案件。虽然单一的证据本身可能说服力不强,但随着证据的累积,它们会加强案情。
不过,有一个有趣的对比。在刑事案件中,风险极高,证明的标准是“排除合理怀疑”。而在科学中,当我们为因果关系建立证据时,通常是基于“概率平衡”。
这个较低的证明门槛反映了这样一种事实:如果出现更好的证据,科学家们愿意修正自己的看法。

因果关系的间接证据类型
科学家用来推断因果关系的间接证据可以有多种形式。这些形式包括:
1. 时间顺序
这是因果关系发生的唯一绝对要求。也就是说,暴露必须发生在结果**之前**,暴露才能**导致**结果。
这一点看起来显而易见,但有时情况并非如此清晰。例如,两起事件之间可能存在很长的滞后期。例如,暴露于石棉纤维与间皮瘤(一种癌症)的发展之间可能间隔 20-60 年。
或者,可能并不清楚什么是暴露,什么是结果:睡眠障碍会导致抑郁,还是睡眠障碍是抑郁症的症状?
2. 关联强度
两个变量之间**强烈**的关联通常被认为是因果关系的证据。也就是说,如果一件事的发生意味着另一件事很可能发生,我们通常认为这是因果关系的好证据。
例如,研究表明高酒精摄入量与肝损伤有关,这表明了强烈的关联。因此,它们对因果关系提供了有力的支持。
3. 研究一致性
如果使用不同方法的各种研究都得出相同或相似的关联,这也有助于证明因果关系的存在。
当科学发现可以被不同的研究方法重复时,我们通常会更有信心。
4. 存在合理的机制
能够证明一种机制可以解释暴露与结果之间的关联,为因果关系提供了进一步的支持。
例如,如果实验室或动物研究表明某种物质如何损伤细胞,这将支持该物质与人类疾病之间的因果关系。
5. 剂量-反应关系
观察到更高的暴露会导致更强的效应,这被认为是因果关系非常有力的证据。
然而,需要注意的是,有时因果关系存在阈值效应。也就是说,暴露要达到一定水平才会导致疾病。这通常适用于传染病,因为在一个人可能生病之前,需要最低的感染剂量。
随机对照试验的力量
间接证据在推断因果关系方面通常发挥着重要作用。但有一种研究是提供因果关系**直接证据**的黄金标准。它被称为随机对照试验,简称 RCT。
在 RCT 中,参与者被随机分配接受干预或作为“对照”。这确保了如果你在两组之间看到差异,那么这只能是干预效果所致。它有效地证明了因果关系的存在。
你可以把它看作是“人赃俱获”的等同。不幸的是,由于伦理和实际方面的考虑,我们并不总是有来自良好 RCT 的证据。
例如,我们没有 RCT 证据表明吸烟会导致肺癌。原因在于,支持因果关系的间接证据如此有力,以至于进行这些研究是不道德的。

因果关系很复杂——所以要警惕那些推销“灵丹妙药”的人
虽然很容易认为因果关系是简单运作的——就像按开关开灯一样——但当涉及到我们的健康时,它通常很复杂,并且涉及多种因素共同作用。
例如,生活方式、基因和环境因素经常相互作用,以决定一个人是否会患上某种疾病。
这种复杂性是我们需要谨慎对待那些提供简单解决方案或“灵丹妙药”来改善健康的人的另一个原因。要实现最佳健康,你需要做各种事情。没有一种单一的习惯、超级食物或补充剂是万能的。