saifyxpro
/

ppo-LunarLander-v3

Reinforcement Learning

stable-baselines3

deep-reinforcement-learning

Eval Results (legacy)

Model card Files Files and versions

saifyxpro commited on Dec 31, 2025

Commit

ee1d620

·

verified ·

1 Parent(s): b7ffaf6

Update README.md

Files changed (1) hide show

README.md +7 -19

README.md CHANGED Viewed

@@ -1,7 +1,7 @@
 ---
 library_name: stable-baselines3
 tags:
-- LunarLander-v3
 - deep-reinforcement-learning
 - reinforcement-learning
 - stable-baselines3
@@ -12,26 +12,14 @@ model-index:
       type: reinforcement-learning
       name: reinforcement-learning
     dataset:
-      name: LunarLander-v3
-      type: LunarLander-v3
     metrics:
     - type: mean_reward
-      value: 249.17 +/- 22.09
       name: mean_reward
       verified: false
 ---
-# **PPO** Agent playing **LunarLander-v3**
-This is a trained model of a **PPO** agent playing **LunarLander-v3**
-using the [stable-baselines3 library](https://github.com/DLR-RM/stable-baselines3).
-## Usage (with Stable-baselines3)
-TODO: Add your code
-```python
-from stable_baselines3 import ...
-from huggingface_sb3 import load_from_hub
-...
-```

 ---
 library_name: stable-baselines3
 tags:
+- LunarLander-v2
 - deep-reinforcement-learning
 - reinforcement-learning
 - stable-baselines3
       type: reinforcement-learning
       name: reinforcement-learning
     dataset:
+      name: LunarLander-v2
+      type: LunarLander-v2
     metrics:
     - type: mean_reward
+      value: 260.46 +/- 15.40
       name: mean_reward
       verified: false
 ---
+# PPO Agent playing LunarLander-v2
+This is a trained model of a PPO agent playing LunarLander-v2.
+Mean reward: 260.46 +/- 15.40