Reinforce 智能体玩 CartPole-v1
这是一个训练好的 Reinforce 智能体玩 CartPole-v1 的模型。 要学习如何使用此模型并训练你自己的模型,请查看深度强化学习课程的第 4 单元:https://huggingface.co/deep-rl-course/unit4/introduction
Evaluation results
- mean_reward on CartPole-v1self-reported500.00 +/- 0.00
这是一个训练好的 Reinforce 智能体玩 CartPole-v1 的模型。 要学习如何使用此模型并训练你自己的模型,请查看深度强化学习课程的第 4 单元:https://huggingface.co/deep-rl-course/unit4/introduction