本文目录一览:
浅谈德州扑克AI核心算法:CFR
在AlphaGo战胜柯洁的同一年,德扑AI DeepStack和Libratus先后在“一对一无限注德州扑克”中击败了职业扑克玩家,实现了不完全信息博弈的突破,而它们所采用的核心算法就是Counterfactual Regret Minimization(CFR)。
“Pluribus”,一款AI扑克牌机器人,最近在六人无限制德州扑克游戏中,击败了人类职业选手,这是AI首次在多人对局中取得如此成就。这篇论文由Noam Brown和Tuomas Sandholm撰写,是他们在复杂博弈算法领域的最新研究成果。
在完美信息游戏中,ReBeL简化为类似AlphaZero的算法。实验结果显示,ReBeL在两个不完美信息博弈中收敛到近似纳什均衡,并在面对面无限注德州扑克中表现出超人的能力,同时使用的领域知识远少于之前的扑克AI。引言 近年来,强化学习与搜索相结合在人工智能领域取得了巨大成功,特别是在完美信息博弈中。