AI「赌王」问世!桥牌胜率83%,吊打8位人类冠军,但不会叫牌

收藏
关键词: 问世
资讯来源:新智元
发布时间: 2022-03-30



  新智元报道  

编辑:袁榭

【新智元导读】2022年3月25日,法国初创公司NukkAI举办的桥牌挑战赛中,其桥牌AI获胜的次数多过人类选手,把人类比下去了。


AI下棋能把人类顶尖选手下到哭、玩星际争霸能赢世界冠军。
 
现在,连人类智力游戏最后的高地-桥牌,AI也能占领了么?这……倒真不一定。
 
 

桥牌AI胜率83%,超过人类冠军


据英国《卫报》报道,AI近日在桥牌比赛中击败了八位世界冠军。直到当时,在这种游戏中,人类一直保持着至高无上的赢家地位,机器的挑战总被击败。
 
这场胜利代表了AI业的一个新里程碑,因为在玩桥牌时,玩家得依靠不完整的信息做出决策,并且必须对其他多名玩家的行为做出反应。这种状况更接近于人类的决策环境。
 
相比之下,人工智能击败人类冠军的国际象棋和围棋,玩家每次比赛只有单个对手,并且两者都拥有盘面上的全部信息。
 
伦敦帝国理工学院机器学习教授Stephen Muggleton因此称:「我们当下所见,代表了AI系统状态的根本性重要进步。」
 
 
2022年3月25日,法国初创公司NukkAI在巴黎举行的为期两天的挑战赛结束时宣布了其AI获胜的消息。
 
NukkAI举办的挑战赛中,要求人类冠军连玩800张牌,分为每次发牌10张的80次竞赛对决。
 
这种赛制去除了桥牌游戏本有的初始叫牌部分。
 
每个人类冠军都用自己和他们的虚拟「明手」搭档的牌对抗一对桥牌机器人程序。
 
这些打牌bot是迄今为止世界上最强的牌类bot,打遍机器人界无敌手,但对决人类顶尖选手时还是输多赢少。
 
NukkAI开发的桥牌AI叫做NooK,在赛制中被安排在和人类冠军一模一样的角色位置,对手bot、牌面牌色完全相同。
 
最后比较AI和人类冠军谁赢的平均次数更多,谁就是最后的胜出者。
 
 
最后NooK赢得了80次中的67次,以83%的优胜率赛过人类冠军,成为最后赢家。
 
NukkAI的联合创始人Jean-Baptiste Fantun表示,他一直相信该公司已经开发了5年的AI能在发牌数好几千的此类赛制中获胜,但这次的发牌数只有800。
 
宣布结果时,2010年菲尔兹奖得主、数学家Cédric Villani称NukkAI是「一个极好的法国创业成功故事」。
 

决策可被解释的「白盒」AI


NukkAI的另一位联合创始人、人工智能研究员Véronique Ventos称 NooK 为「新一代人工智能」,因为它的决策可被解释。
 
她说:「在桥牌中,如果你无法解释自己的决策,就很难真正玩下去」。因为完全的桥牌赛程必须依赖于合作伙伴之间的沟通。
 
可解释性是AI领域的热门话题。Muggleton表示:「近年来,公众所听到的关于机器学习的大部分成就,都是基于AlphaGo等黑盒系统,它无法向人类解释自己如何做出决策。 」
 
相反,NooK代表了一种「白盒」或「神经符号」方法。 它不是通过玩数十亿次游戏试错来习得玩法,而是首先学习游戏规则,然后再通过练习改进技能。 NooK是基于规则和深度学习系统的混合体,这种学习方式更近于人类。
 
 
美国罗德岛布朗大学计算机科学教授Michael Littman说:「业界的钟摆正朝着这些方式的方向摆动。无法解释事件何以发生的智能体,在以后的社会中是行不通的。」
 
Littman说,即使一个人或AI无法用语言表述他们在做什么,他们的行为也需要让其他智能体「清晰易懂」、行事准则得是共通且可理解的。
 
这在医疗和工程等领域至关重要。 例如,未来自动驾驶汽车们在通过路口或变线抢道时,需要能够读取彼此的行为。
 
英国多次世界桥牌冠军、NooK的本次挑战者之一Nevena Senior称NooK的发明者们完成了一项「了不起的」工作。 她发现这款AI比人类更能读懂对手,更能利用他们的错误。 「这是人类在获得足够经验后才会做的事情,我很惊喜地发现AI模仿了典型的人类技能。」
 

赢了,但没完全赢:桥牌AI竟然不会叫牌


Littman教授对本次桥牌挑战不包括叫牌感到失望,这是桥牌过程中的沟通和欺骗所在的最有趣部分。
 
但Nevena Senior表示,人类和NooK拿到的发牌牌色变数很大,以至于没有叫牌的打牌过程也同样丰富。
 
不过不止教授失望,广大网友也纷纷表示,没有叫牌,算什么AI在桥牌上战胜人类。
 
叫牌这个步骤,是桥牌中最具人类决策性质的,AI现在仍然无法复刻。光靠发牌的变量不能完全替代叫牌。
 
 
桥牌,全称合约桥牌,是两对双人搭档对峙的四人纸牌游戏。
 
双方需要在叫牌过程中互相竞争,确定「定约」。然后在打牌的时候,通过与队友的默契配合,获得「定约」目标的「墩数」,才算获胜。
 
对于AI来说,围棋与桥牌、或者说弈与博,在博弈计算中的根本区别,在于棋是完全信息动态博弈,而牌属于非完全信息动态博弈。
 
 
棋类竞赛中,对峙双方所掌握的局势信息是公开的、对称的,盘面一望即知、无遮无拦,AI只需要处理公开的完全局势数据。
 
而桥牌中,单个玩家开始时拿到的一手牌,得到的信息只是一副牌的四分之一,是不完整的。
 
在叫牌阶段,每个玩家需要在对手的干扰下与搭档交换自己的牌面信息、并干扰对手获得牌面信息。
 
通过叫牌,玩家能知道一部分同伴和对手的牌面信息,然后需要对不明情况进行猜测、判断和分析。
 
到了打牌阶段,作为牌搭子的两名玩家可以看到两家「明手」的牌面,也就是一副牌的二分之一,依然是不完整信息。
 
随着牌局的进行,隐藏手牌代表的未知信息越来越少,直到最后一轮牌打完,盘面才清晰。
 
所以桥牌的叫牌,是实行牌搭子间合作、对手间欺敌、体现和利用决策环境迷雾的关键步骤。
 
所以这次大家的反应才会如此:AI不会叫牌,算什么战胜人类呢。
 
 
不过,现实世界中大部分人类的互动都是同时存在合作与竞争,而且行为体都依据非公开、不完整的私有信息进行决策,同时不乏欺诈、伪饰、误导等干扰性操作。
 
如果AI真能在完整的桥牌游戏中胜过人类,那么真的代替人类进行决策、甚至成为「通用人工智能」(AGI),似乎也不再是梦想了。


参考资料:

https://www.theguardian.com/technology/2022/mar/29/artificial-intelligence-beats-eight-world-champions-at-bridge
https://www.springerprofessional.de/en/the-search-algorithm-for-the-game-of-bridge/19762716
https://www.youtube.com/watch?v=DHpeHCsojbI
https://twitter.com/nukkailab1