

“一项实用研究发现,性取向可以通过手指的长度来确定”是近期的一个标题,该标题基于埃塞克斯大学(University of Essex)研究人员的一项同行评审研究,该研究发表在《性行为档案》(Archives of Sexual Behavior)上,这是人类性行为领域领先的学术出版物。
而在我这个懂统计的眼里,这简直是一派胡言。
就在新闻消费者似乎变得越来越精明——记得要询问科学研究是否“同行评审”了、样本量是否足够大、以及研究资金的来源——的时候,一篇“一拳击倒”式的报道又出现了。这次,它以“置信区间”的形式袭来,这是一个普通人为了理解一篇新闻报道而不应该接触的统计学话题。
但可悲的是,对于那些不擅长数字的人来说,如果你不想被浮夸、过度炒作或毫无价值的研究愚弄,我们还是得聊聊一些即使在所有“合法研究”的勾选框都被打上勾的情况下,仍可能让你上当的统计学原理。

我的真实风险有多大?
我读过的最令人沮丧的标题之一是“八年研究发现,常吃炸薯条者死亡几率翻倍”。“天哪,”我一边啜饮着我的红酒,面前摆着一大篮子金黄诱人的炸薯条,一边脱口而出。真的吗?
是的,根据发表在《美国临床营养学杂志》(American Journal of Clinical Nutrition)上的一项同行评审研究,这是真的。吃炸薯条确实会将你的死亡风险增加一倍。但是,吃了多少炸薯条,更重要的是,我原本的死亡风险是多少?
研究称,如果你每周吃三次或更多次炸土豆,你的死亡风险就会翻倍。所以,我们来取研究中的一个普通人:一个60岁的男性。无论他吃多少炸薯条,他的死亡风险是多少?1%。这意味着,如果你把100个60岁的男人排成一队,至少有一个人因为他是个60岁的男人而在明年去世。
现在,如果这100个男人在他们的一生中,每周都吃三次或更多次的炸土豆,是的,他们的死亡风险就会翻倍。但是,1%翻倍是多少?2%。所以,在这一年中,死去的不是100人中的1个,而是2个。而且他们还可以一周吃三次或更多的炸土豆,并且能吃一辈子——这听起来是我愿意承担的风险。
这是一个叫做相对风险的统计概念。如果患某种疾病的几率是十亿分之一,即使你的患病风险翻了四倍,你的风险仍然只有十亿分之四。这几乎不可能发生。
所以下次你看到风险增加或减少时,你应该问的第一个问题是“风险增加或减少是基于什么原始风险。”
此外,就像我一样,那些男人在吃炸薯条的时候,有没有可能也在享受一杯葡萄酒或一品脱啤酒?会不会是其他什么东西才是真正的原因?
睡前吃奶酪等于死于床单缠绕?
婴儿床垫已经成为一项时髦的国家赞助礼品,送给新生儿父母,旨在为新生儿提供安全的睡眠场所。这项倡议源自20世纪30年代末芬兰的一项旨在降低婴儿睡眠相关死亡的努力。纸板箱里包含一些必需品:尿布、婴儿湿巾、连体衣、哺乳垫等。

随着这些婴儿床垫的引入,芬兰的婴儿死亡率迅速下降,该国现在拥有世界上最低的婴儿死亡率之一。因此,推测这些婴儿床垫导致婴儿死亡率下降是有道理的。
但是,你知道什么也改变了吗?产前护理。为了获得婴儿床垫的资格,女性被要求从怀孕的头四个月开始就去看健康诊所。
1944年,31%的芬兰母亲接受了产前教育。1945年,这一比例跃升至86%。婴儿床垫并没有导致婴儿死亡率的变化;而是教育和早期健康检查起了作用。
这是一个经典的相关性不等于因果关系的案例。婴儿床垫的引入和婴儿死亡率的下降是有联系的,但并非一个导致了另一个。
然而,这一小事实并未阻止婴儿床垫公司如雨后春笋般涌现,销售诸如“婴儿床垫套装:芬兰原装”等产品,售价仅为449.99美元。而美国各州则使用纳税人的钱给新妈妈们发放一个版本。
所以下次你看到一个联系或关联——比如吃奶酪与死于床单缠绕有关——你应该问:“还有什么可能导致这种情况发生?”
当误差范围大于效果时
劳工统计局(Bureau of Labor Statistics)的最新数据显示,全国失业率从8月份的3.9%降至9月份的3.7%。在统计这些数据时,劳工统计局显然不会挨家挨户询问每个人是否有工作。它会询问一小部分人口样本,然后将该群体中的失业率推广到整个美国。
这意味着,任何时候的官方失业水平都是一个估计值——一个很好的猜测,但仍然是猜测。这种“正负误差”由统计学家称为置信区间的东西来定义。
数据实际显示,全国失业人数似乎减少了27万——但存在一个由置信区间定义的正负26.3万的误差。宣布一个像27万这样的数字更容易。但抽样调查总会带来误差,更准确的看法是将这个单一的估计值看作一个范围。在这种情况下,统计学家认为失业人数的真实下降幅度,低端只有7000人,高端则高达53.3万人。
这与定义性取向的手指长度研究中遇到的问题相同——这些估计值相关的正负误差可能会抵消结果中的任何确定性。
置信区间让我们的生活变得混乱的最明显例子是在民意调查中。民意调查员会抽取人口样本,询问该样本打算投票给谁,然后从中推断出整个国家在选举日会做什么。当选情胶着时,其民意调查样本的正负误差会抵消对谁将获胜的任何真实了解,使得选情“过于胶着,无法预测”。
所以下次当你看到一个关于整个群体但不可能询问到每个人或测试到每个对象的数字时,你应该询问其正负误差。
了解这三个统计误导的方面,是否意味着你永远不会被愚弄?不。但它们肯定会有帮助。
Liberty Vittert是华盛顿大学的统计学访问助理教授。本文最初发表在The Conversation。
