A2C Agent playing CartPole-v1
Sur ce dépôt on retrouve un modèle entraîné avec Stable-Baselines3 pour résoudre l'environnement CartPole-v1.
Rendu Vidéo
Détails de l'entraînement
- Algorithme : A2C (Advantage Actor-Critic)
- Environnement : CartPole-v1
- Nombre de pas (timesteps) : 25 000
- Framework : Stable-Baselines3
- Downloads last month
- 115
Evaluation results
- Mean Reward on CartPole-v1self-reported500.000