这是自1997年加里·卡斯帕罗夫与IBM的“深蓝”计算机对弈国际象棋以来,人类与机器之间最受瞩目的较量。谷歌 DeepMind 将于今晚开始一场五局围棋比赛的第一次对弈,对手是该项目的世界冠军。
AlphaGo,谷歌 DeepMind 的人工智能算法,将面对李世石,后者在过去十年中一直保持着世界顶尖围棋选手的头衔。
AlphaGo 此前曾在2015年10月的一场比赛中击败欧洲冠军樊麾。然而,李世石是一个更强大的对手。围棋排名有些令人困惑且略显复杂,但根据 Michael Fu 在 Quora 上的计算,基于先前的棋力评分,樊麾在统计上只有25%的机会击败李世石。
围棋是一种两人对弈游戏,在19×19的棋盘上进行。每回合,一名玩家放置一颗圆形棋子,称为“石子”,以策略性地围住对方的棋子。一名玩家代表黑石,另一名代表白石。这个19×19的网格为每一步棋和游戏的每一种结果创造了近乎无限的可能性。当“深蓝”与加里·卡斯帕罗夫对弈国际象棋时,机器每秒能够比较2亿步棋,以确定哪一步最有利。然而,在围棋中,这并非可能,因为可能的结局数量过于庞大。
DeepMind 负责人 Demis Hassabis 告诉 The Verge,国际象棋每回合有大约20个可能的落子,而围棋每回合有大约200个可能的落子,这极大地增加了计算的复杂性。
为了做出这些决定,AlphaGo 依赖于两个深度神经网络,这些由数学方程式组成的层分析了数千万盘先前的围棋对局。一个网络预测其见过的下一个最佳短期走法,另一个网络则决定该走法是否有利于赢得整场比赛。如果有利,AlphaGo 就会执行该走法。但由于 AlphaGo 只是一个算法,它仍然需要人类代理来实际放置棋子。
AlphaGo 赢得这些比赛将是对谷歌 DeepMind 在基于游戏的 [人工智能](https://www.theverge.com/2016/3/8/11178462/google-deepmind-go-challenge-ai-vs-lee-sedol/) 领域工作的肯定。他们相信,通过掌握具有固定参数和规则的游戏,就像物理定律或人为制定的法律一样,我们可以在受控环境中训练人工智能算法。像与李世石的比赛这样的练习的价值在于算法在有限时间内解决极其复杂问题的能力。
驱动 AlphaGo 决策引擎的计算方式,有一天也可能驱动你的汽车。通过扩展我们在部署这些网络方面的知识和能力,即使是在有限的棋盘游戏中,AlphaGo 的胜利也将向世界展示,人工智能已经准备好进行严肃的应用。
本次比赛的奖金为100万美元,如果 AlphaGo 获胜,奖金将捐赠给联合国儿童基金会、STEM 和围棋慈善机构。
比赛将在 YouTube 上于美国东部时间晚上11点(太平洋标准时间晚上8点)开始直播。每场比赛预计持续4-5小时。
美国围棋选手 Michael Redmond,拥有超过500场比赛的胜利,将担任每场比赛的英语解说。
五场比赛将于3月9日、10日、12日、13日和15日进行,均于韩国时间下午1点开始(前一天美国东部时间晚上11点)。对于西方观众来说,那就是3月8日、9日、11日、12日和14日的晚上11点。