20世纪30年代,英国填字游戏作者爱德华·波伊斯·马瑟斯创作了一本名为《该隐的颌骨》的小说,这是一道“极其困难的文学谜题”。解开这个凶杀悬疑的关键在于按照正确的顺序将书中的100页内容拼接起来,从而揭示六起谋杀案及其发生过程。
据《卫报》报道,自该书首次出版以来,(已知的)只有四个人成功解开了谜题。但这个古老的谜团在 TikTok 用户Sarah Scannel的推广下,通过 TikTok 重新引起了人们的兴趣,并促使Unbound出版社重印了7万册。去年,《华盛顿邮报》报道称,这部小说迅速获得了一批狂热的追随者,新一批好奇的侦探们在社交媒体的在线社区中公开讨论他们的进展。在Reddit等网站上,名为r/CainsJawbone的板块已有超过7600名成员。
那么,机器学习能帮助破解密码吗?一小群人正在尝试。上个月,出版商Unbound与人工智能平台Zindi合作,向读者发起挑战,让他们使用人工智能自然语言处理算法来排序页面。TikTok用户blissfullybreaking在一则视频中解释说,使用人工智能的一个优势是,它可以识别出我们可能忽略的20世纪30年代的流行文化典故,并将其与那个时期的相关文学作品进行交叉引用。
[相关:Meta希望通过研究人脑来改进其人工智能]
这是一个很有前景的方法。自然语言处理模型已经能够成功解析阅读理解测试,通过大学入学考试,(准确率不一地)简化科学文章,起草法律简报,构思故事创意,并玩基于聊天的策略棋盘游戏。如果给人工智能足够多的《犯罪现场调查》(CSI)来“ binge-watch”,它也能成为一名相当称职的新手侦探。
Zindi要求解决方案必须是开源的并且是公开可用的,团队只能使用他们为本次比赛提供的数据集。此外,提交的代码必须是可复现的,并且要完整记录使用了哪些数据、实现了哪些特征以及代码运行的环境。
领先团队的一名成员,用户“skaak”,在他于Zindi网站的讨论帖中解释了他如何应对这一挑战。他指出,在对团队的模型进行了无数次调整后,他的结论是,仍然需要“人工校准”来指导模型理解某些引用和文化知识。
比赛已于除夕结束,共有222名参与者报名,但评分将在1月晚些时候最终确定,请继续关注本月晚些时候的统计数据和结论。