

如果你打算在这个假期季坐下来玩像国际象棋这样的老式棋盘游戏,那么请记住你与计算机相比有多么糟糕,这可能会让你感到沮丧。事实上,计算机已经证明它们有能力在棋盘游戏上击败人类一段时间了。还记得1997年深蓝对阵加里·卡斯帕罗夫吗?计算机赢了。或者2016年AlphaGo在韩国对阵李世石的围棋比赛?同样如此。
事实上,围棋大师李世石正在退休——他谈到了人工智能的不可战胜性。《卫报》援引韩国联合通讯社报道称:“随着人工智能在围棋比赛中的出现,我意识到即使我成为第一名,我仍然不是最顶尖的。”
去年,开发出AlphaGo(2016年以4比1击败李世石的算法)的同一团队庆祝了一项更了不起的成就:一个能够自学并赢得三款不同游戏的的人工智能系统。这个人工智能是一个网络,但可以用于多种游戏;这种通用性使其更加令人印象深刻,因为它也可能能够学习其他类似的游戏。
他们称之为AlphaZero,它懂得国际象棋、将棋(被称为日本象棋)和围棋,围棋是一种复杂的棋盘游戏,黑白棋子在一个大网格上对弈。所有这些游戏都属于“全信息”或“完美信息”竞赛类别——每个玩家都能看到整个棋盘,并拥有相同的信息。这与扑克等游戏不同,因为在扑克游戏中,你不知道对手手中有什么牌。
“AlphaZero完全是自主学习的,只是通过与自己对弈,”开发它的DeepMind公司的软件工程师Julian Schrittwieser说。“我们对游戏有了全新的认识,这种认识不受人类传统游戏方式的影响。”Schrittwieser是2018年发表在《科学》杂志上描述AlphaZero的一项研究的合著者,该研究于2017年首次公布。
Schrittwieser说,由于AlphaZero比赢得围棋比赛的人工智能“更通用”,因为它能玩多种游戏,“这表明我们很有可能将其扩展到我们将来可能想要解决的更多现实世界问题中。”
该网络首先需要被告知游戏规则,然后它通过与自己对弈来学习。围棋训练花了大约13天,而国际象棋只花了9个小时。之后,它很快就开始击败那些已经精通这些游戏的计算机程序。例如,在将棋方面,AlphaZero只用了两个小时就开始击败另一款名为Elmo的程序。事实上,DeepMind在一篇博客文章中吹嘘该人工智能是国际象棋、将棋和围棋“历史上最强的玩家”。Schrittwieser说,相同的算法可以“毫无问题地”用于玩其他“全信息”游戏,如六子棋。
这款新人工智能与2016年击败李世石的人工智能系统相似。那场引起轰动的比赛是一部名为《AlphaGo》的出色纪录片的主题,目前正在Netflix上播放。如果你对人工智能与人类的对抗领域感兴趣——或者对迷人而古老的围棋感兴趣,那么这部纪录片值得一看。
IBM Research的研究科学家Murray Campbell说,虽然这是现代人工智能研究,但棋盘游戏历来是测试计算机能力的好方法,他也是同一期《科学》杂志上关于AlphaGo主题的一篇论文的作者。他说,让计算机玩棋盘游戏的想法可以追溯到1950年,到了20世纪90年代,机器已经能够击败人类玩跳棋和国际象棋。“我们在这些游戏上付出了数十年的努力才达到了比人类玩得更好的程度,”Campbell说。“我认为它们为这个领域服务得很好;它们让我们能够探索AlphaZero中使用的技术。”
Campbell补充说,从事AlphaZero相关技术的工作经验,将有助于该领域实现“更复杂的任务”。“这首先就是解决游戏的根本原因——不是为了游戏本身,而是因为它是一个受约束的环境,我们可以从中取得进展。”
至于人类棋手,即使李世石正在退休,他仍然计划在12月进行一次“最后的挑战”,据《韩国时报》报道:他将对阵另一款在韩国开发的人工智能,名为Handol。
这个故事最初发布于2018年12月。它已更新了关于李世石退休以及即将与新人工智能比赛的消息。
