我们的主要算法CFR产生一种称为纳什均衡的策略组合的近似。纳什均衡是一种策略组合(所有参与玩家的策略集),使得没有单个玩家有动机偏离。它代表了玩家之间的平衡点,在这一点上,没有玩家通过改变自己的策略获得额外收益...
浏览 76 次 标签: 对抗性遗憾最小化:扑克AI战胜职业选手的核心技术