A2C Agent playing CartPole-v1

Sur ce dépôt on retrouve un modèle entraîné avec Stable-Baselines3 pour résoudre l'environnement CartPole-v1.

Rendu Vidéo

Détails de l'entraînement

  • Algorithme : A2C (Advantage Actor-Critic)
  • Environnement : CartPole-v1
  • Nombre de pas (timesteps) : 25 000
  • Framework : Stable-Baselines3
Downloads last month
115
Video Preview
loading

Evaluation results