Synthcite24
/

ppo_final_done

Reinforcement Learning

deep-reinforcement-learning

custom-implementation

Eval Results (legacy)

Model card Files Files and versions

Metrics Training metrics Community

Synthcite24 commited on Apr 19, 2025

Commit

0bc5edb

·

verified ·

1 Parent(s): 16526c8

Update README.md

Files changed (1) hide show

README.md +4 -4

README.md CHANGED Viewed

@@ -13,8 +13,8 @@ model-index:
       type: reinforcement-learning
       name: reinforcement-learning
     dataset:
-      name: LunarLander-v3
-      type: LunarLander-v3
     metrics:
     - type: mean_reward
       value: -133.10 +/- 53.34
@@ -24,7 +24,7 @@ model-index:
   # PPO Agent Playing LunarLander-v3
-  This is a trained model of a PPO agent playing LunarLander-v3.
   # Hyperparameters
   ```python
@@ -36,7 +36,7 @@ model-index:
 'wandb_project_name': 'cleanRL'
 'wandb_entity': None
 'capture_video': False
-'env_id': 'LunarLander-v3'
 'total_timesteps': 50000
 'learning_rate': 0.00025
 'num_envs': 4

       type: reinforcement-learning
       name: reinforcement-learning
     dataset:
+      name: LunarLander-v2
+      type: LunarLander-v2
     metrics:
     - type: mean_reward
       value: -133.10 +/- 53.34
   # PPO Agent Playing LunarLander-v3
+  This is a trained model of a PPO agent playing LunarLander-v2.
   # Hyperparameters
   ```python
 'wandb_project_name': 'cleanRL'
 'wandb_entity': None
 'capture_video': False
+'env_id': 'LunarLander-v2'
 'total_timesteps': 50000
 'learning_rate': 0.00025
 'num_envs': 4