

本文最初发布于 The Conversation。
100多年前,亚历山大·格拉汉姆·贝尔(Alexander Graham Bell)呼吁《国家地理》杂志的读者做一件大胆而新颖的事情——“开创一门新科学”。他指出,基于声音和光线测量的科学已经存在。但却不存在气味科学。贝尔呼吁他的读者“测量气味”。
如今,大多数人手中的智能手机提供了基于声音和光线科学的令人印象深刻的内置功能:语音助手、面部识别和照片增强。气味科学目前没有提供与之匹敌的东西。但这种情况正在改变,因为机器嗅觉(也称为“数字化嗅觉”)的进步终于响应了贝尔的行动号召。
由于人类嗅觉的复杂性,机器嗅觉的研究面临着艰巨的挑战。而人类视觉主要依赖于视网膜中的感光细胞——视杆细胞和三种视锥细胞——嗅觉则是通过鼻腔中约400种嗅觉感受器细胞来体验的。
机器嗅觉始于检测和识别空气中分子的传感器。这些传感器与您鼻腔中的感受器具有相同的功能。
但要对人们有用,机器嗅觉需要更进一步。该系统需要知道某种分子或一组分子对人类来说闻起来是什么味道。为此,机器嗅觉需要机器学习。
将机器学习应用于气味
机器学习,尤其是被称为深度学习的一种机器学习,是语音助手和面部识别应用程序等非凡进步的核心。
机器学习也是嗅觉数字化的关键,因为它可以学会将致味化合物的分子结构映射到文本气味描述符。机器学习模型学习人类倾向于用来描述他们遇到特定致味化合物(如香草醛)时的词语,例如“甜”和“甜点”。
然而,机器学习需要大量数据集。网络上有数量庞大得难以想象的音频、图像和视频内容,可用于训练识别声音和图像的人工智能系统。但机器嗅觉长期以来一直面临数据短缺问题,部分原因是大多数人无法像描述视觉和听觉那样轻松且准确地用语言描述气味。在没有网络规模数据集的情况下,研究人员无法训练出非常强大的机器学习模型。
然而,随着2015年DREAM嗅觉预测挑战赛的推出,情况开始发生变化。该比赛发布了研究嗅觉的生物学家Andreas Keller和Leslie Vosshall收集的数据,并邀请了来自世界各地的团队提交他们的机器学习模型。模型需要根据致味化合物的分子结构来预测“甜”、“花”或“水果”等气味标签。
表现最佳的模型于2017年发表在《科学》杂志上。一种经典的机器学习技术——随机森林,它结合了多个决策树流程图的输出——最终获胜。
我是一名机器学习研究员,长期以来一直对将机器学习应用于化学和精神病学感兴趣。DREAM挑战赛引起了我的兴趣。我也对嗅觉有一种个人联系。我的家族根源可以追溯到印度北部的一个小镇 Kannauj,那里是印度的香水之都。此外,我的父亲是一名化学家,他一生的大部分时间都在分析地质样本。因此,机器嗅觉提供了一个在香水、文化、化学和机器学习交叉领域不可抗拒的机会。
DREAM挑战赛结束后,机器嗅觉的进展开始加速。在 COVID-19 大流行期间,报告了许多嗅觉丧失,或称 anosmia的病例。通常处于次要地位的嗅觉,在公众意识中地位上升。此外,一项名为Pyrfume Project的研究项目,公开了更大、更多的数据集。
深度嗅觉
到2019年,最大的数据集已从DREAM挑战赛的不到500个分子增加到约5000个分子。由Alexander Wiltschko领导的Google研究团队终于能够将深度学习革命带入机器嗅觉领域。他们的模型基于一种称为图神经网络的深度学习,在机器嗅觉领域取得了最先进的成果。Wiltschko现在是Osmo的创始人兼首席执行官,该公司的使命是“赋予计算机嗅觉”。
最近,Wiltschko和他的团队使用图神经网络创建了一个“主气味图”,其中感知相似的气味比不相似的气味更靠近。这并不容易:分子结构的微小变化可能导致嗅觉感知的巨大变化。反之,两种分子结构截然不同的分子,其气味却可能几乎相同。
这种在解读气味代码方面的进展不仅在智力上令人兴奋,而且具有高度应用前景,包括个性化香水和香料、更好的驱虫剂、新型化学传感器、疾病早期检测以及更逼真的增强现实体验。机器嗅觉的未来看起来一片光明。它也预示着美好的气味。