人工智能现在可以在扑克牌桌上占据主导地位,而 Facebook 掌握着所有王牌

像这样的机器人可以在真实场景中部署,例如拍卖。

如果你曾经将生活中的竞争情况比作一场国际象棋比赛,你可能会认为扑克是更好的比喻。国际象棋只有两个玩家,每个玩家都可以获得所有相同的信息——这被称为“完美信息”游戏。但现实生活通常不是这样的。考虑一个普遍但复杂的情况:一家公司正在试图招聘一个人,但他们不知道这家潜在员工还在面试哪些其他公司,或者他们还有其他哪些录用机会。这比下棋更像打扑克。求职者隐藏了自己的底牌,甚至可能虚张声势来掩饰自己牌的好坏。

这种情况推动了人工智能的研究。计算机科学家希望他们开发的算法能够在具有多个隐藏变量的场景中取得成功。在这方面,Facebook的一个部门FAIR(Facebook人工智能研究)和卡内基梅隆大学合作开发了一款在扑克方面“超越人类”的人工智能。这类技术可能对游戏桌的虚拟桌面之外产生深远的影响。

FAIR的研究科学家Noam Brown在描述他们的人工智能扑克奇才时说:“它是世界上六人无限注德州扑克中最好的玩家。”

软件在击败国际象棋、跳棋、围棋等游戏中的其他玩家方面已经表现出色。虽然人工智能已经能够赢得双人扑克比赛,但这里的突破是,这款名为Pluribus的新型人工智能系统能够主宰多人游戏。描述Pluribus的研究论文于今天在《科学》杂志上发表。

就像人类一样,人工智能在手牌较弱时也可以虚张声势。Brown说:“它专注于玩一种不可预测的策略。“如果它只在手牌很好时下注,那么对手就会知道该弃牌。”

该人工智能不将虚张声势视为欺骗,而是将其视为一种让对手弃牌的策略,即使它的手牌很弱。“同样重要的是,机器人能够识别出当它的对手下注时,它可能没有一副强牌,”他补充说,这意味着机器人或许应该跟注。

机器人不会根据它看到的人类行为来改变自己的技术——它只会坚持“固定策略”。为了测试它,Facebook将这款人工智能与15名扑克专家进行了较量,他们在12天内与该机器人玩了数千局。“对手无法找到有效的策略来适应这个机器人,”Brown说。“他们未能找到可以利用和利用的弱点。”为了学会如何变得如此优秀,人工智能与自身的副本进行了八天的对抗。

职业扑克玩家Darren Elias在Facebook提供的一份声明中说:“我是最早测试这个机器人的玩家之一,所以我看到了它的早期版本。“在几周内,这个机器人就从一个可以被击败的普通玩家,成长为与世界上最好的玩家竞争的水平。”另一位玩家Jason Les说:“尽管我尽了最大努力,但我未能找到一种可以利用它的方法。”

这款人工智能在处理所有这些变量方面的能力,使其在扩展到更实际的场景方面前景广阔。Brown说:“如果我们想在现实世界中部署人工智能,它必须能够应对世界的这些方面。“我们正朝着这个方向迈出重要一步。”

卡内基梅隆大学计算机科学教授、新研究的资深作者Tuomas Sandholm表示,自1970年以来,扑克一直是人工智能领域不完美信息游戏(即一些信息对玩家隐藏的游戏)的一个重要基准。“很明显,许多现实世界的应用——并非所有,但很多——都不是两人零和博弈,”他说。

想象一下,多方谈判或拍卖等场景,一个无懈可击的扑克式机器人将是部署它的那一方的关键资产。

Brown说,人类未能发现他们的扑克算法中的弱点这一点很重要,如果他们想在现实世界中使用像这样的AI机器人。“当你大规模部署一个AI系统时,如果其中存在弱点,那么总会有人发现这些弱点,”他说,“你必须拥有一个AI,它能够被不可利用。”

 

更多优惠、评测和购买指南

 
Rob Verger Avatar

Rob Verger

技术编辑

罗布·沃格尔是《流行科学》杂志的前技术编辑。他擅长报道航空、交通和军事技术。


© .