我们能预测流感爆发吗?

流感病毒每年在全球范围内可导致高达 64.6 万人死亡。
child in hospital bed
我们能预测流感吗? Surabky/DepositPhotos

你可能不会认为在互联网上过度分享信息是一种救命的习惯,但也许它就是。十多年来,流行病学家和数据科学家一直在扫描我们的搜索引擎查询和社交媒体帖子,以辨别谁受到了感染,他们得了什么病,以及他们住在哪里。然而,从我们咨询“谷歌医生”中得出有意义的结论,面临着一个讽刺性的障碍:尽管我们发布了大量的快照、自拍和状态更新,但我们分享的信息不足以持续预测疾病的爆发——包括流感。当然,流感的恐怖统治比我们现代社交网络的诞生要早得多。一百年前,臭名昭著的“西班牙流感”迅速蔓延到世界各地,感染了三分之一的人口,并导致至少 5000 万人死亡。随着病毒的快速进化,以及国际旅行和城市化的增加使得疾病传播迅速,这种大流行的现代版本可能会导致两倍的伤亡,并对全球的粮食、药品和能源供应造成广泛的干扰。你住在哪里,或者你做什么,都不重要。流感可能会感染你。即使没有“流感末日”的出现,提高我们预测这种疾病的能力也至关重要。流感病毒每年在全球范围内可导致高达 64.6 万人死亡,其中包括在美国多达 5.6 万人。美国每年在对抗这种瘟疫的医疗费用上花费高达 58 亿美元。如果我们知道它何时会来,卫生部门就可以敦促人们接种疫苗。医院也可以提前计划。

通过互联网收集的数据来补充疾病控制与预防中心(CDC)的官方流感报告,是我们在线发展的又一步。根据皮尤研究中心 2012 年的一项研究,约有 1.84 亿美国人(占全国居民的一半以上)使用网络查找健康相关信息。这些搜索就像是拨打犯罪热线的提示,使研究人员能够识别疑似流感病例。2006 年,多伦多大学公共卫生副教授 Gunther Eysenbach 发现,“流感”或“流感症状”的搜索量在医生就诊人数增加一周前就开始激增。他于 2006 年写道:“互联网使得过去无法衡量的事物变得可衡量了”,并创造了一个新的领域,称为“信息流行病学”。

2008 年,谷歌推出了 Flu Trends,利用其自身的大数据,通过搜索 29 个国家的症状来寻找全球流感疫情的激增和热点地区。谷歌于 2014 年取消了该项目——至少有一个因素是研究人员没有预料到的。

事实证明,你的搜索历史可能会产生误导。数据收集者无法知道你是在为自己搜索“头痛和发烧”,还是因为你听说你的同事在抱怨他孩子的症状。2007 年,美国人突然开始谷歌搜索“霍乱”——是否爆发了新的疫情?不。奥普拉·温弗瑞刚刚推荐了《霍乱时期的爱情》作为她读书俱乐部的书。罗斯基尔德大学流行病学教授 Lone Simonsen 说:“你应该看看布拉德·皮特得了病毒性脑膜炎时发生了什么。”

在从公共资源中筛选搜索数据后,研究人员会通过复杂的算法来处理它们。这些公式揭示的模式可以让调查人员将其与 CDC 或其他卫生机构关于疾病的报告进行比较。如果计算机生成的预测与现实相符,我们就知道专家们正在做正确的事情。

搜索查询不是研究人员挖掘流感线索的唯一数据来源。太平洋西北国家实验室的数据科学家 Svitlana Volkova 在 Twitter 上寻找有价值的信息。她最近验证了一种新的深度学习方法,该方法可以探测推文中流感的迹象。在一项对三年内发布的超过 1.7 亿条推文进行的分析中,Volkova 和她的同事发现,他们的模型可以准确地在地方层面进行为期三天的流感样疾病预测。这比等待 CDC 的流感报告要快得多,因为 CDC 的报告滞后多达两周。(Facebook 表示它不从事流感预测业务,所以目前,你的生病表情符号并不能带来更大的福祉。)

社交媒体为研究人员提供了更多数据,但仍然存在局限性。令人恼火的是,我们在网上展示的形象并不总是与我们在家里的饱受鼻涕困扰的样子相符。科罗拉多大学博尔德分校的信息科学家 Michael Paul 最近发现,人们很少在推特上谈论自己流感样症状。事实上,研究人员发现,人们在生病时推特发帖更少。所以,下次你喜欢的 Twitter 名人似乎异常安静时,可能是因为他们厌倦了 Twitter——但也可能是因为他们生病了。Paul 还研究了 Instagram,发现急性疾病是照片发布中最不常见的健康话题。毫不奇怪,患流感的人不喜欢自拍。

包括 Simonsen 在内的疾病侦探希望电子健康记录可以补充来自我们推文和帖子的数据。保险索赔表格,其中列出了疾病及其治疗方法,尤其重要。但人们通常不愿意与研究人员分享私人的健康数据。

流行病学家希望缓解这些隐私担忧。他们只想要数字,而不是姓名。但最终的决定权在于个人。Simonsen 说,公众必须权衡利弊:“一方面是隐私,另一方面是了解更多的需求。” 鉴于欧盟今年实施了《通用数据保护条例》,让人们在如何使用自己的信息方面拥有更大的发言权,这种权衡变得更加重要。

相关:上个流感季节接种流感疫苗的人数减少了——这可能就是为什么它是最致命的一个季节的原因

Simonsen 说,增加一个用于记录健康状况的应用程序的信息——就像我们使用健身追踪器或饮食计划一样——可以使基于大数据的流感预测更加准确。私营公司也可能跟进:联合国儿童基金会正与包括 IBM 在内的多家公司合作,收集数据以改善对全球疾病的应对。

最终,大数据预测下一次流感大流行的潜力可能取决于全球各地人们是否会过度分享我们的疾病。我们越多地在推特上谈论我们的 #flu 症状,产生的数据就越多。我们越允许公司与研究人员分享这些数据,他们就能做出更准确的预测。Volkova 说,所有这些分享“将帮助世界”。

本文最初发表在《大众科学》2018 年冬季“危险”特刊上。

 

更多优惠、评测和购买指南

 
© .