Farbum
/

AC_PandaReachv3

Reinforcement Learning

PandaReachDense-v3

deep-reinforcement-learning

custom-implementation

Eval Results (legacy)

Model card Files Files and versions

Farbum commited on Apr 2, 2024

Commit

83fa027

·

verified ·

1 Parent(s): f3c9a54

Update README.md

Files changed (1) hide show

README.md +1 -1

README.md CHANGED Viewed

@@ -24,7 +24,7 @@ model-index:
   # Actor-Critic Agent Playing PandaReachDense-v3
-  This is a trained model of an AC agent playing PandaReachDense-v3.
   # Hyperparameters
   hp_seed: 2444<br />hp_torch_deterministic: True<br />hp_total_timesteps: 20500<br />hp_critic_nstep: 1<br />hp_num_envs: 12<br />hp_learning_rate_actor: 0.001<br />hp_learning_rate_critic: 0.005<br />hp_minlr_actor: 2e-06<br />hp_minlr_critic: 1e-05<br />hp_gamma: 0.99<br />hp_reg_term: 3<br />hp_batch_size: 64

   # Actor-Critic Agent Playing PandaReachDense-v3
+  This is a trained model of an A2C agent playing PandaReachDense-v3.
   # Hyperparameters
   hp_seed: 2444<br />hp_torch_deterministic: True<br />hp_total_timesteps: 20500<br />hp_critic_nstep: 1<br />hp_num_envs: 12<br />hp_learning_rate_actor: 0.001<br />hp_learning_rate_critic: 0.005<br />hp_minlr_actor: 2e-06<br />hp_minlr_critic: 1e-05<br />hp_gamma: 0.99<br />hp_reg_term: 3<br />hp_batch_size: 64