Push agent to the Hub

Files changed (3) hide show

README.md CHANGED Viewed

@@ -17,14 +17,14 @@ model-index:
       type: LunarLander-v2
     metrics:
     - type: mean_reward
-      value: -181.90 +/- 126.29
       name: mean_reward
       verified: false
 ---
 # PPO Agent Playing LunarLander-v2
       This is a trained model of a PPO agent playing LunarLander-v2.
       ## Evaluation Results
-      - Mean Reward: -181.90 ± 126.29
       - Number of Evaluation Episodes: 10
       ## Hyperparameters
       ```python

       type: LunarLander-v2
     metrics:
     - type: mean_reward
+      value: -223.63 +/- 133.13
       name: mean_reward
       verified: false
 ---
 # PPO Agent Playing LunarLander-v2
       This is a trained model of a PPO agent playing LunarLander-v2.
       ## Evaluation Results
+      - Mean Reward: -223.63 ± 133.13
       - Number of Evaluation Episodes: 10
       ## Hyperparameters
       ```python

logs/events.out.tfevents.1750047698.2f208e49a865 ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:3d3a5a19b0779055fa417104f3eef84eb0bb7de7be90adc1e1b1be14069e3c84
+size 433186

results.json CHANGED Viewed

	@@ -1 +1 @@
1	- {"env_id": "LunarLander-v2", "mean_reward": -~~181~~.~~89562423336105~~, "std_reward": ~~126~~.~~2925732280044~~, "n_evaluation_episodes": 10, "eval_datetime": "2025-06-16T04:19:28.~~798775~~"}


1	+ {"env_id": "LunarLander-v2", "mean_reward": -223.6344459904147, "std_reward": 133.12613218024208, "n_evaluation_episodes": 10, "eval_datetime": "2025-06-16T04:22:31.860447"}