Upload PPO LunarLander-v2 trained agent

Files changed (3) hide show

README.md CHANGED Viewed

@@ -1,7 +1,7 @@
 ---
 library_name: stable-baselines3
 tags:
-- LunarLander-v3
 - deep-reinforcement-learning
 - reinforcement-learning
 - stable-baselines3
@@ -12,17 +12,17 @@ model-index:
       type: reinforcement-learning
       name: reinforcement-learning
     dataset:
-      name: LunarLander-v3
-      type: LunarLander-v3
     metrics:
     - type: mean_reward
-      value: 251.80 +/- 38.09
       name: mean_reward
       verified: false
 ---
-# **PPO** Agent playing **LunarLander-v3**
-This is a trained model of a **PPO** agent playing **LunarLander-v3**
 using the [stable-baselines3 library](https://github.com/DLR-RM/stable-baselines3).
 ## Usage (with Stable-baselines3)

 ---
 library_name: stable-baselines3
 tags:
+- LunarLander-v2
 - deep-reinforcement-learning
 - reinforcement-learning
 - stable-baselines3
       type: reinforcement-learning
       name: reinforcement-learning
     dataset:
+      name: LunarLander-v2
+      type: LunarLander-v2
     metrics:
     - type: mean_reward
+      value: 252.64 +/- 18.58
       name: mean_reward
       verified: false
 ---
+# **PPO** Agent playing **LunarLander-v2**
+This is a trained model of a **PPO** agent playing **LunarLander-v2**
 using the [stable-baselines3 library](https://github.com/DLR-RM/stable-baselines3).
 ## Usage (with Stable-baselines3)

ppo-LunarLander-v2.zip CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:868200f3517edafd73e639e713c9989957d66548577606b9a7bf7c63ae6cbdd5
 size 149352

 version https://git-lfs.github.com/spec/v1
+oid sha256:fb19c851b6347d5c2e2c6177aeb4a3d96113f463d9be586cf59d2e402af71932
 size 149352

results.json CHANGED Viewed

	@@ -1 +1 @@
1	- {"mean_reward": ~~251~~.~~8008495~~, "std_reward": 38.~~0919353405297~~, "is_deterministic": true, "n_eval_episodes": 10, "eval_datetime": "2026-01-06T18:17:31.~~972201~~"}


1	+ {"mean_reward": 252.64425849999998, "std_reward": 18.578851837712854, "is_deterministic": true, "n_eval_episodes": 10, "eval_datetime": "2026-01-06T18:27:50.633774"}