Push agent to the Hub

Files changed (4) hide show

README.md CHANGED Viewed

@@ -17,14 +17,14 @@ model-index:
       type: LunarLander-v2
     metrics:
     - type: mean_reward
-      value: -256.71 +/- 117.21
       name: mean_reward
       verified: false
 ---
 # PPO Agent Playing LunarLander-v2
       This is a trained model of a PPO agent playing LunarLander-v2.
       ## Evaluation Results
-      - Mean Reward: -256.71 ± 117.21
       - Number of Evaluation Episodes: 10
       ## Hyperparameters
       ```python

       type: LunarLander-v2
     metrics:
     - type: mean_reward
+      value: -181.90 +/- 126.29
       name: mean_reward
       verified: false
 ---
 # PPO Agent Playing LunarLander-v2
       This is a trained model of a PPO agent playing LunarLander-v2.
       ## Evaluation Results
+      - Mean Reward: -181.90 ± 126.29
       - Number of Evaluation Episodes: 10
       ## Hyperparameters
       ```python

logs/events.out.tfevents.1750047514.2f208e49a865 ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:2bce602b032a954feb7ade115beaf9f08fefb0fb03f99ad35ca4db3b0dcf0cdd
+size 433186

model.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:6f1f80e2873f57c3654acade153177b22cf260938ebe2829a170cc5bb5f3ebb1
 size 42898

 version https://git-lfs.github.com/spec/v1
+oid sha256:4d466f4852f3d65424844a9c82c43106d7fca7784014b68e98a14007c311fa3b
 size 42898

results.json CHANGED Viewed

	@@ -1 +1 @@
1	- {"env_id": "LunarLander-v2", "mean_reward": -~~256~~.~~7072636878181~~, "std_reward": ~~117~~.~~20978945433933~~, "n_evaluation_episodes": 10, "eval_datetime": "2025-06-16T04:03:25.~~286241~~"}


1	+ {"env_id": "LunarLander-v2", "mean_reward": -181.89562423336105, "std_reward": 126.2925732280044, "n_evaluation_episodes": 10, "eval_datetime": "2025-06-16T04:19:28.798775"}