Upload PPO LunarLander-v3 trained agent

Files changed (5) hide show

.gitattributes CHANGED Viewed

@@ -33,3 +33,4 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text

 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text
+replay.mp4 filter=lfs diff=lfs merge=lfs -text

README.md CHANGED Viewed

@@ -16,16 +16,19 @@ model-index:
       type: LunarLander-v3
     metrics:
     - type: mean_reward
-      value: 262.11 +/- 18.76
       name: mean_reward
       verified: false
 ---
 # **PPO** Agent playing **LunarLander-v3**
 This is a trained model of a **PPO** agent playing **LunarLander-v3**
 using the [stable-baselines3 library](https://github.com/DLR-RM/stable-baselines3).
 ## Usage (with Stable-baselines3)
 TODO: Add your code
@@ -34,4 +37,4 @@ from stable_baselines3 import ...
 from huggingface_sb3 import load_from_hub
 ...
-```

       type: LunarLander-v3
     metrics:
     - type: mean_reward
+      value: 249.05 +/- 22.84
       name: mean_reward
       verified: false
 ---
 # **PPO** Agent playing **LunarLander-v3**
 This is a trained model of a **PPO** agent playing **LunarLander-v3**
 using the [stable-baselines3 library](https://github.com/DLR-RM/stable-baselines3).
 ## Usage (with Stable-baselines3)
 TODO: Add your code
 from huggingface_sb3 import load_from_hub
 ...
+```

ppo-LunarLander-v3.zip CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:9e08c5afd64ac052ba260848d4d560e108cf76feed6667b7828dc1c723a7d495
 size 150018

 version https://git-lfs.github.com/spec/v1
+oid sha256:0f8d4ee68f5c69a211490827c47e00a3bed50fd7442aabc851341dc1ed7212d3
 size 150018

replay.mp4 ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:13a189a937069e1241cf3929c37295290d11724831cd87b6a4f36fe77af3f523
+size 172294

results.json CHANGED Viewed

	@@ -1 +1 @@
1	- {"mean_reward": ~~262~~.~~1123929~~, "std_reward": 18.~~760983661343836~~, "is_deterministic": true, "n_eval_episodes": 10, "eval_datetime": "2025-08-29T09:28:31.~~203644~~"}


1	+ {"mean_reward": 249.04974040000002, "std_reward": 22.84209448961791, "is_deterministic": true, "n_eval_episodes": 10, "eval_datetime": "2025-08-29T09:29:04.881144"}