Upload PPO LunarLander-v3 trained agent

Files changed (3) hide show

README.md CHANGED Viewed

@@ -1,7 +1,7 @@
 ---
 library_name: stable-baselines3
 tags:
-- LunarLander-v3
 - deep-reinforcement-learning
 - reinforcement-learning
 - stable-baselines3
@@ -12,17 +12,17 @@ model-index:
       type: reinforcement-learning
       name: reinforcement-learning
     dataset:
-      name: LunarLander-v3
-      type: LunarLander-v3
     metrics:
     - type: mean_reward
-      value: 261.65 +/- 12.75
       name: mean_reward
       verified: false
 ---
-# **PPO** Agent playing **LunarLander-v3**
-This is a trained model of a **PPO** agent playing **LunarLander-v3**
 using the [stable-baselines3 library](https://github.com/DLR-RM/stable-baselines3).
 ## Usage (with Stable-baselines3)

 ---
 library_name: stable-baselines3
 tags:
+- LunarLander-v2
 - deep-reinforcement-learning
 - reinforcement-learning
 - stable-baselines3
       type: reinforcement-learning
       name: reinforcement-learning
     dataset:
+      name: LunarLander-v2
+      type: LunarLander-v2
     metrics:
     - type: mean_reward
+      value: 253.38 +/- 21.91
       name: mean_reward
       verified: false
 ---
+# **PPO** Agent playing **LunarLander-v2**
+This is a trained model of a **PPO** agent playing **LunarLander-v2**
 using the [stable-baselines3 library](https://github.com/DLR-RM/stable-baselines3).
 ## Usage (with Stable-baselines3)

ppo-LunarLander-v2.zip CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:c29fae543a15d2a76d759cd49dce387b7e6443fb67f5d91717c745524489566c
 size 150010

 version https://git-lfs.github.com/spec/v1
+oid sha256:37a435b0d0d579e541f41f3ffd6742fb6b34d7d96687d22c7803f2aafe652329
 size 150010

results.json CHANGED Viewed

	@@ -1 +1 @@
1	- {"mean_reward": ~~261~~.~~6524924269665~~, "std_reward": 12.~~745176220250524~~, "is_deterministic": true, "n_eval_episodes": 10, "eval_datetime": "2025-12-~~26T11~~:57:13.~~162190~~"}


1	+ {"mean_reward": 253.38031412891593, "std_reward": 21.910044201686116, "is_deterministic": true, "n_eval_episodes": 10, "eval_datetime": "2025-12-26T12:00:59.562502"}