新華社華盛頓7月11日電(記者周舟)美國卡內基-梅隆大學11日宣布,該校和臉書公司合作開發的人工智慧Pluribus在六人桌德州撲克比賽中擊敗多名世界頂尖選手,成為機器在多人遊戲中戰勝人類的一個裏程碑。
美國《科學》雜志11日線上發表的相關論文顯示,Pluribus與13名德州撲克高手進行了1萬手不限注對局的六人桌比賽,每次比賽中由機器對5名人類選手,結果機器取得勝利。
在另外一種形式的六人桌比賽中,由5個Pluribus與1名人類選手對局,結果機器分別在5000手對局中先後擊敗了德州撲克世界冠軍達倫·伊萊亞斯和克裏斯·弗格森。
在比賽中,Pluribus會讓自己變得難以預測。例如常規打法是在牌最好的時候押注,但這很快會被對手識破,因此它會“耍點心眼”,不按常理出牌。分析顯示,它會做出一些多數人類玩家都認為不好的決策,這在客觀上也迷惑了對手。
研究人員指出,與讓機器下西洋棋和圍棋相比,德州撲克的挑戰更大。德州撲克比賽中每方都不知道對手的牌,對手還可能在押注時虛張聲勢,因此決策只能基于不完全資訊,這與真實世界中的問題更接近。
卡內基-梅隆大學教授圖奧馬斯·桑德霍爾姆説,此前人工智慧在“戰略性推理”方面取得的成就僅限于二人遊戲,此次在復雜遊戲中戰勝5名人類選手,將為人工智慧解決真實世界問題提供新的可能性。
據介紹,在二人遊戲中,機器的策略是實現博弈論中的“納什均衡”,即確保結果至少是平局,而只要對手犯錯打破均衡,機器就能獲勝。但這一策略不適用于多人遊戲,因此機器不能保平,必須不斷爭取先手才能最終獲勝。研究人員為此設計了一種新的“有限前瞻搜索”演算法,讓機器能做出一個平衡的整體決策。
2017年,卡內基-梅隆大學開發的人工智慧Libratus曾在12萬手一對一不限注德州撲克比賽中分別戰勝4名人類選手。
-
大數據"坑熟客",技術之罪需規則規避
2018-03-02 08:58:39
-
高品質發展,怎麼消除“遊離感”?
2018-03-02 08:58:39
-
學校只剩一名學生,她卻堅守了18年
2018-03-01 14:40:53
-
有重大變動!騎共用單車的一定要注意了
2018-03-01 14:40:53
-
2018年,樓市會有哪些新變化?
2018-03-01 09:01:20