关于【强化学习】Q-learning训练AI走迷宫的资讯_【强化学习】Q-learning训练AI走迷宫相关的资讯

2024-06-21 17:31:03

Q-learning是一种基于强化学习的算法，用于解决Markov决策过程（MDP）中的问题。这类问题我们理解为一种可以用有限状态机表示的问题。它具有一些离散的状态state、每一个state可以通过动作actio...