Upload PPO LunarLander-v3 trained agent with video

Files changed (3) hide show

README.md CHANGED Viewed

@@ -16,7 +16,7 @@ model-index:
       type: LunarLander-v3
     metrics:
     - type: mean_reward
-      value: 231.92 +/- 82.77
       name: mean_reward
       verified: false
 ---

       type: LunarLander-v3
     metrics:
     - type: mean_reward
+      value: 247.42 +/- 59.58
       name: mean_reward
       verified: false
 ---

ppo-LunarLander-v3.zip CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:c37ba6a1e331a0e412d93fd6288fd65ed1f5c6c1b99341e222cc2e261c1bd916
 size 150588

 version https://git-lfs.github.com/spec/v1
+oid sha256:14f08b631a08f5ac6a47ff81c2008edd7a5d1e39733c37394cc1d8398e38078d
 size 150588

results.json CHANGED Viewed

	@@ -1 +1 @@
1	- {"mean_reward": ~~231~~.~~91903040000003~~, "std_reward": 82.~~77191904721573~~, "is_deterministic": true, "n_eval_episodes": 10, "eval_datetime": "2025-07-24T17:54:58.~~325057~~"}


1	+ {"mean_reward": 247.4160338, "std_reward": 59.576907989618675, "is_deterministic": true, "n_eval_episodes": 10, "eval_datetime": "2025-07-24T17:59:23.131301"}