【深度强化学习】(5) DDPG 模型解析,附Pytorch完整代码

深度确定性策略梯度算法(DeterministicPolicyGradient,DDPG)。DDPG算法使用演员-评论家(Actor-Critic)算法作为其基本框架,采用深度神经网络作为策略网络和动作...

【深度强化学习】(1) DQN 模型解析,附Pytorch完整代码

DQN(DeepQNetwork)是深度神经网络和Q-Learning算法相结合的一种基于价值的深度强化学习算法。DQN同时用到两个结构相同参数不同的神经网络,区别是一个用于训练,另一个不会在短期内得...