这款由人工智能驱动的大脑扫描仪可以释义你的想法

尽管具有潜在的沟通益处,研究人员已经开始警惕未来可能出现的“心理隐私”问题。
Man prepping person for fMRI scan.
将人工智能训练与fMRI扫描仪相结合,已经取得了一些令人印象深刻的沟通进展。Nolan Zunk/德克萨斯大学奥斯汀分校

德克萨斯大学奥斯汀分校的研究人员开发了一种突破性的“语义解码器”,该解码器利用人工智能将人类大脑的言语活动扫描转化为释义文本。尽管与源文本相比,该技术仍相对不精确,但这一发展代表了人工智能在辅助技术方面发挥作用的一个重大进步——而其开发者已经警告说,如果不加以适当监管,它可能会被滥用。

该团队的研究成果于周一首次发表在《自然·神经科学》杂志上,详细介绍了一种新系统,该系统集成了类似于OpenAI的GPT-4Google Bard的生成程序,以及能够解释功能性磁共振成像(fMRI)扫描仪的技术。fMRI扫描仪可以监测血液流向大脑特定区域的方式和位置。虽然早期的脑机接口(BCI)在实现类似的翻译能力方面显示出潜力,但德克萨斯大学奥斯汀分校的版本据称是第一个非侵入性的版本,不需要任何实际的物理植入物或电线。

在这项研究中,研究人员让三名受试者每人花共计16小时在fMRI机器中听播客。同时,团队通过分析Reddit评论和自传文本来训练一个AI模型,使其能够创建和解析语义特征。通过融合这两个数据集,AI学会了将与受试者大脑扫描相关的词语和短语进行匹配,从而创建语义联系。

在此步骤之后,参与者再次被要求躺在fMRI扫描仪中,听取不属于原始数据的新音频。然后,语义解码器通过大脑活动扫描将音频翻译成文本,甚至在受试者观看无声视频片段或在脑海中想象自己的故事时,也能产生类似的结果。虽然AI的转录通常会提供不相关的或用词不精确的答案,但总体输出仍然成功地释义了受试者的内心独白。有时,它甚至能准确地复述音频中的词语选择。正如《纽约时报》所解释的那样,结果表明德克萨斯大学奥斯汀分校团队的AI解码器不仅仅捕捉词语顺序,而是实际的隐含意义。

[相关:脑机接口远非埃隆·马斯克所描绘的那样容易。]

虽然仍处于非常早期的阶段,但研究人员希望未来改进的版本能为那些失去口语能力的人提供强大的新沟通工具,例如中风患者或患有肌萎缩侧索硬化症(ALS)的人。目前,fMRI扫描仪是庞大、不可移动的机器,仅限于医疗机构,但该团队希望研究类似的系统是否可以利用功能性近红外光谱(fNIRS)来工作。

然而,这种新的语义解码器有一个主要的限制——受试者必须通过专注于目标来有意识地、协同地配合AI程序的意图。简单来说,越是忙碌的大脑,转录的文本就越混乱。同样,这种解码技术也一次只能对一个人进行训练。

尽管存在这些当前的限制,研究团队已经预见到快速进步与滥用的可能性。该团队在其研究中写道:“[未来的发展可能使解码器能够绕过这些(隐私)要求。”“此外,即使在没有受试者配合的情况下,解码器的预测可能是不准确的,但也可能被故意误解以达到恶意目的……出于这些和其他未预见的原因,提高对脑解码技术风险的认识并制定保护每个人心理隐私的政策至关重要。”

 

更多优惠、评测和购买指南

 
© .