

本文最初发布于 The Conversation。
当OpenAI于2025年7月发布“学习模式”时,该公司吹捧了ChatGPT的教育益处。“当ChatGPT被提示进行教学或辅导时,它可以显著提高学业成绩,”该公司教育副总裁在产品发布会上告诉记者。但任何一位尽职尽责的老师都会想知道:这只是营销噱头,还是学术研究真的支持这些说法?
尽管生成式AI工具正以闪电般的速度进入教室,但关于这个问题的扎实研究进展却远未跟上。一些早期研究显示,AI对某些群体有益,例如计算机编程学生和英语学习者。此外,还有许多关于AI在教育中应用的乐观研究,例如2025年5月发表在《Nature》杂志上的一项研究,该研究表明聊天机器人可能有助于学习和高级思维。但该领域的学者指出,许多这类研究论文存在显著的 metodological 缺陷。
其他研究则描绘了一幅更为严峻的图景,表明AI可能会损害表现或认知能力,例如批判性思维技能。一篇论文显示,学生在使用ChatGPT学习的过程中使用得越多,在后来没有ChatGPT的类似任务上的表现就越差。
换句话说,早期研究才刚刚开始触及这项技术将如何真正影响长期学习和认知。我们还能从哪里寻找线索?作为一名研究过大学生如何使用AI的认知心理学家,我发现我的领域为识别AI何时能成为大脑的助推器,何时有变成大脑的拖累提供了有价值的指导。
技能来自努力
认知心理学家认为,我们的思想和决策是两种处理模式的结果,通常被称为系统1和系统2。
前者是一种模式匹配、直觉和习惯的系统。它速度快且自动化,所需的有意识注意力和认知努力很少。我们日常许多活动——穿衣服、泡咖啡、骑车上班或上学——都属于此类。而系统2通常是缓慢而深思熟虑的,需要更多的有意识注意力和有时痛苦的认知努力,但往往能产生更稳健的输出。
我们需要这两个系统,但获得知识和掌握新技能在很大程度上依赖于系统2。挣扎、阻力和精神上的努力对于学习、记忆和加强大脑连接的认知工作至关重要。每当一个自信的骑行者骑上自行车时,他们都依赖于通过许多小时的系统2努力学习骑车而建立起来、来之不易的系统1模式识别。没有付出认知努力和压力,你就无法掌握技能,也无法有效地将信息进行组块以进行更高级的处理。
我告诉我的学生,大脑很像肌肉:需要真正的努力才能看到进步。不挑战那块肌肉,它就不会变大。
如果机器替你完成工作呢?
现在想象一个机器人陪你一起去健身房,替你举重,你无需费力。不久之后,你自己的肌肉就会萎缩,甚至搬动重箱子等简单任务也需要依赖家里的机器人。
AI若使用不当——比如用来完成测验或写文章——会让学生绕过他们发展知识和技能所必需的环节。它剥夺了精神锻炼。
利用技术有效地将认知任务外包可能会对学习和记忆产生不利影响,并可能导致人们误判自己的理解或能力,从而导致心理学家所说的元认知错误。研究表明,习惯性地将导航任务外包给GPS可能会损害空间记忆,而使用Google等外部来源来回答问题会使人们对自己个人知识和记忆过于自信。
当学生将认知任务交给AI时,是否存在类似的风险?一项研究发现,使用ChatGPT而不是传统网络搜索来研究某个主题的学生,在任务过程中认知负荷较低(他们不需要过多思考),但他们对研究主题的推理能力却更差。表面上使用AI可能会在短期内减轻认知负担,但这就像让机器人替你进行健身房锻炼一样。最终会导致思维能力的下降。
在另一项研究中,学生使用AI修改论文的得分高于那些不使用AI修改论文的学生,这通常仅仅是通过复制粘贴ChatGPT的句子实现的。但这些学生在实际知识增长或知识迁移方面并没有比那些不使用AI的同龄人做得更好。AI组也更少地参与了严谨的系统2思维过程。作者警告说,这种“元认知上的懒惰”可能会促成短期表现的提高,但也会导致长期技能的停滞。
一旦有了基础,外包就可以变得有用。但如果没有大脑进行必要的初始工作来编码、连接和理解你试图掌握的问题,这些基础就无法形成。
使用AI支持学习
回到健身房的比喻,学生们将AI视为一位私人教练可能会很有用,这位教练可以通过跟踪和支撑学习,并激励他们更努力地工作,来帮助他们保持专注。AI作为一种可扩展的学习工具,一个永不休眠、拥有庞大知识库的个性化导师,具有巨大的潜力。
AI技术公司正致力于设计这样的产品:终极导师。除了OpenAI进军教育领域,2025年4月,Anthropic发布了其Claude的学习模式。这些模型被设计成进行苏格拉底式对话,提出问题并提供提示,而不是直接给出答案。
早期研究表明AI导师可能是有益的,但也带来了问题。例如,一项研究发现,高中生通过ChatGPT复习数学的表现比不使用AI的学生差。一些学生使用了基础版本,另一些学生使用了提供提示但不泄露答案的定制导师版本。当学生们在稍后的考试中没有AI的情况下进行考试时,那些使用基础ChatGPT的学生比那些在没有AI的情况下学习的学生表现差得多,但他们并没有意识到自己的表现变差了。那些使用导师机器人的学生表现与不使用AI复习的学生没有区别,但他们错误地认为自己表现得更好。因此,AI并没有起到帮助作用,反而引入了元认知错误。
即使导师模式得到改进和完善,学生也必须主动选择该模式,而且目前还必须配合,熟练地提供上下文,并引导聊天机器人远离无价值的、低水平的问题或奉承。
后者的这些问题可以通过更好的设计、系统提示和自定义界面来解决。但使用默认模式AI来逃避艰苦工作的诱惑,将继续是教学、课程设计和激励学生避免会削弱其认知锻炼的捷径方面一个更根本和经典的问题。
与智能手机、互联网甚至写作本身等其他复杂技术一样,研究人员需要更多时间来充分理解AI对认知和学习的真正影响范围。最终,其图景可能是一个细致入微的画面,很大程度上取决于上下文和使用场景。
但是,我们对学习的了解告诉我们,无论是否有AI,深厚的知识和技能的掌握始终需要真正的认知锻炼。