

在纽约这样拥挤的城市地区,你不可能与可能生病的人保持距离。如果你离开了你的公寓——甚至可能没离开——你很有可能身边有过感冒的人,而你 根本不知道。
罗切斯特大学的一个团队希望找到一种改变这种情况的方法。如果你知道自己曾与出现流感症状的人有过接触,你会采取预防措施吗?通过更好的信息是否可以控制流感爆发?该团队开始挖掘纽约人带有地理标记的推特数据,结果令人震惊——该团队发现,他们可以预测一个人在出现症状前大约八天就会感染流感。
这听起来有点像谷歌流感趋势(通过记录一个地理区域内人们搜索流感相关词汇的次数和频率来监测疫情爆发),但它超越了这一点。通过在一个月内分析440万条带有地理位置数据的推文,并使用一种特殊的算法,该团队能够绘制出城市中流感发病率的热力图。该算法知道如何区分非字面意义的词语(“今天真的受够了工作;)”)和真正表达流感症状的推文。通过GPS标记,他们还可以看到这些感觉不适的人在城市中的活动轨迹,以及其他与他们擦肩而过的发推者。
最终的分析表明,研究人员能够以大约90%的准确率预测健康发推者在长达八天前即将生病。不过,不要误解这个数字。研究人员在他们认为健康人可能生病的情况下,大约有90%是正确的,但这并不包括系统中未能捕捉到的所有生病的人。
换句话说,它并不完美,但它确实为一些有趣的公共卫生应用打开了大门。例如,如果你在某一天去过某个症状高发地区,你可能会收到一条推文,告诉你未来一周生病的风险很高。是时候拿出紫锥菊了。