

世界各地的学生正在使用生成式人工智能工具来撰写论文和完成作业。教师也在使用类似的工具来批改考卷。这一切究竟是怎么回事?这一切将走向何方?教育能否回到人工智能出现之前的世界?
有多少学生在学校使用生成式人工智能?
许多高中生和大学生在 2022 年初开始引起国际关注时,就拥抱了诸如 OpenAI 的 ChatGPT 等流行的 生成式人工智能 写作工具。其诱因非常明显。只需几个简单的提示,当时的 大型语言模型 (LLMs) 就能快速浏览它们庞大的文章、书籍和档案数据库,并在几秒钟内输出相对连贯的短篇论文或问题回答。语言并不完美,模型容易捏造事实,但它们足以蒙混过一些当时尚未做好准备识别人工智能操纵的明显迹象的教育工作者。
这一趋势像野火一样蔓延。根据最近的一项皮尤研究调查,在美国,约有五分之一听说过 ChatGPT 的高中生表示,他们已经将该工具用于课堂作业。根据。另一份来自 ACT(美国最受欢迎的大学入学标准化考试之一)的报告称,近一半 (46%) 的高中生使用人工智能完成了作业。高等教育领域也出现了类似趋势。在线教育杂志 Intelligent.com 对美国大学生进行的调查显示,超过三分之一 (37%) 的大学生使用 ChatGPT 来产生想法、撰写论文,或两者兼有。
这些人工智能工具正在被用于评分的论文中。Turnitin,一家被教育工作者广泛使用的知名抄袭检测公司,最近告诉《连线》杂志,去年它在其服务中发现有 2200 万篇大学和高中提交的论文存在人工智能操纵的证据。在 2023 年提交的 2 亿篇论文中,Turnitin 声称有 11% 的论文超过 20% 的内容据称是使用人工智能生成的材料。虽然公众普遍使用人工智能的情况有所降温,但学生们并没有表现出停止使用的迹象。
教育工作者转向不完美的人工智能检测工具
学生开始使用人工智能写作工具后,教师几乎立即转向使用其他人工智能模型来试图阻止他们。截至撰写本文时,数十家科技公司和初创企业声称已开发出能够检测人工智能生成文本迹象的软件。全国各地的教师和教授已经或多或少地依赖这些工具。但批评者认为,即使在 ChatGPT 普及多年后,人工智能检测工具的准确性仍然远非完美。
《国际教育诚信杂志》近期对 18 种不同人工智能检测工具的分析强调了其缺乏全面的准确性。所研究的模型均未能准确区分人工智能生成的材料与人类写作。更糟糕的是,只有五种模型的准确率高于 70%。随着人工智能写作模型的不断改进,检测难度可能会进一步增加。
准确性问题并非限制人工智能检测工具有效性的唯一问题。过度依赖这些仍在发展的检测系统,可能会惩罚那些可能使用其他情况下允许的、有益的人工智能软件的学生。北佐治亚大学的学生 Marley Stevens 最近就遇到了这种情况,她声称人工智能检测工具将她使用流行的拼写和写作辅助工具 Grammarly 视为作弊。Stevens 声称她在该论文中获得了零分,这使她失去了竞争奖学金的资格。
“我与老师、系主任和院长谈过,他们说我‘无意中作弊了’,”Stevens 在 TikTok 帖子中声称。北佐治亚大学没有立即回应《流行科学》的置评请求。
有证据表明,目前的人工智能检测工具还会错误地将真实的人类写作误认为人工智能内容。除了普遍存在的假阳性外,斯坦福大学的研究人员警告说,检测工具可能会不成比例地惩罚非母语者的写作。研究中包含的美国出生、非母语的八年级学生撰写的论文中,超过一半 (61.2%) 被归类为人工智能生成的。在研究测试的七种不同人工智能检测工具中,至少有一种工具将 97% 的非母语者论文标记为人工智能生成的。广泛推广的检测工具可能会给那些已经需要克服语言障碍的非母语者施加更大的压力。
学校如何应对人工智能的兴起?
教育工作者正争先恐后地寻找应对人工智能写作激增的解决方案。纽约和洛杉矶的一些主要学区已选择完全禁止使用 ChatGPT 及相关工具。尽管认识到其准确性存在已知缺陷,全国各地的大学教授们已开始不情愿地使用人工智能检测软件。密歇根理工大学的写作学教授、其中一位教育工作者,在接受《高等教育内幕》采访时,将这些检测器描述为“一个可能有所帮助的工具,但我们要认识到它存在缺陷,并且可能会惩罚一些学生”。
与此同时,另一些人则采取了相反的方法,更加欢迎人工智能教育工具。据《德克萨斯论坛报》报道,德克萨斯州教育部本周就将几千份标准化考试的人工评分替换为“自动化评分系统”。该机构声称,其新的评分系统将对州公共考试中的开放式书面回答进行评分,每年可为该州节省 1500 万至 2000 万美元。同时,这将导致约 2000 名临时评分员失业。在该州的其他地方,一所小学据报道正在尝试使用人工智能学习模块来教授孩子们核心基础课程,然后由人类教师进行补充。
人工智能在教育领域:一种新的常态
虽然人工智能写作检测工具可能会发展以提高准确性并减少误报,但它们不太可能单独将教育带回 ChatGPT 出现之前的时代。一些学者认为,与其对抗新的常态,教育工作者不如拥抱教室和讲堂中的人工智能工具,并指导学生如何有效使用它们。在麻省理工学院斯隆管理学院的一篇博客文章中,研究人员认为教授和教师仍然可以限制某些工具的使用,但他们应该通过清晰的书面规则来解释其理由。他们写道,学生应该敢于主动与老师沟通,询问何时可以使用以及何时不适合使用人工智能工具。
另一些人,例如前埃隆大学教授 C.W. Howell,主张在课堂环境中明确且有意地向学生展示人工智能生成的写作,这实际上可能会降低他们使用人工智能的可能性。Howell 在《连线》杂志撰文称,让学生评估一篇人工智能生成的论文,可以让学生亲身体验人工智能是如何捏造来源或凭空捏造引语的。从新的视角来看,人工智能生成的论文实际上可以改善教育。
Howell 写道:“向我的学生展示 ChatGPT 有多么糟糕,有助于恢复他们对自己思维和能力的信心。”
当然,如果人工智能像一些末日论者所认为的那样,从根本上改变了经济格局,那么学生们可以一直花时间学习如何编写提示来训练人工智能,并为他们新的人工智能主导的未来做出贡献。