

可以把它想象成小学毕业。在花了三年时间构建其机器学习软件后,今天一家公司宣布其软件通过了第一次测试——验证码。
Vicarious 是一家总部位于旧金山的公司,致力于教导软件发展视觉感知能力。最终,该视觉系统应能够识别所有出现的字母,辨认照片中的物体,并普遍完成任何视力正常的孩子都能做到的事情。破解验证码,即网站经常用于区分人类用户和垃圾邮件机器人而使用的扭曲字母图案,是 Vicarious 的第一份进展报告。Vicarious 的创始人表示,他们的软件平均能以 90% 的准确率解决验证码问题。(然而,它在 Google 街景的数字识别上遇到了困难,这是 Google 最新发布的 reCAPTCHA 软件,于 10 月 25 日发布。)
“验证码是一个很好的测试,因为它能代表你在一般感知中遇到的许多问题,”Vicarious 的创始人之一 Dileep George 告诉《大众科学》。“例如,变体——字母的数量变化。从混乱和重叠中识别字母的难度。这些都是一般视觉也必须解决的问题。”
该软件使用机器学习,这是一项在 20 世纪 80 年代开创的技术,程序员通过向程序输入数千个字母“A”的示例来“教授”程序诸如字母“A”的形状等概念。其理念是,用几行代码很难向计算机解释“A”是什么……但计算机仍然可以通过足够的训练数据自己弄清楚。George 和他的同事们表示,他们通过构建一个通过示例学习的程序来推动了该领域的发展,但与需要数千个示例不同,它只需要每个字母 10 个示例。Vicarious 的联合创始人 Scott Phoenix 表示,这使得该程序更像人类的学习者:“人类不需要 10,000 个鹿或蛇的例子才能知道它们是什么。”此外,该软件可以在笔记本电脑上运行,这意味着它不需要非凡的计算能力来运行,使其具有商业化潜力。
“如果他们能向其展示任意一张图片并告诉我图片中的内容,那就太神奇了。”
“我认为他们所做的事情非常令人印象深刻,”加拿大滑铁卢大学的研究员 Chris Eliasmith 表示,他从事一个名为 Spaun 的大脑模型研究,并且不是 Vicarious 的一部分。“我相信他们在基础机器学习方面取得了进展,这些问题在很长一段时间内一直是该领域的固有难题。”
然而,对于公司以外的工程师来说,很难说 Vicarious 在构建其人工智能方面真正取得了多大的进展。Eliasmith 指出,虽然从 10 个示例中学习字母听起来很棒,但这取决于程序只需要 10 个任何类型的示例,还是需要更多示例来识别不同的字体。George 和 Phoenix 在截稿前没有回复要求澄清的电子邮件。
此外,尽管验证码的全称——完全自动化的公共图灵测试,用于区分计算机和人类——引人注目,但这并不能真正表明一个程序接近人类智能。毕竟,你无法与一个验证码破解器进行对话。
“它能破解验证码这一事实,并不能暗示它像人类一样思考,”验证码的最初创建者 Luis von Ahn 说。“我并不是说他们走错了方向。他们可能走对了方向。我只是不知道。”
其他团体也开发了破解验证码的程序,所以这项壮举并非新鲜事。“我认为这是破解者中准确率较高的一种,”von Ahn 说。这样的进步并非验证码的终结,尽管随着时间的推移,破解验证码很可能会发展到公司需要依赖另一种垃圾邮件机器人守门人的地步。von Ahn 说,下一步是要求人们识别照片中的物体。
Vicarious 声称其程序的工作方式类似于人类大脑,但 von Ahn 和 Eliasmith 都表示,很难判断该软件是否比其他机器学习软件更像大脑。部分原因可能是 Vicarious 没有完全公开其程序的数学原理,这对于一家商业公司来说是可以理解的。相反,《大众科学》采访的外部研究人员不得不依赖公司制作的一个短视频。
von Ahn 表示,有一件事会让他对人工智能视觉软件印象深刻:“如果他们能向其展示任意一张图片并告诉我图片中的内容,那就太神奇了。这仍然不能说明它是否像人类一样思考,但至少我从未见过计算机能做到这一点。”
Phoenix 表示,Vicarious 正在努力使其软件能够识别照片中的动物,但该公司尚未准备好公布其准确率。Eliasmith 说,Vicarious 没有保证会第一个或最好地做到这一点,因为许多团队都在研究这个问题。我们需要等待 Vicarious 在其开发上取得更大的进展,才能证明其实力。