Push agent to the Hub

Files changed (3) hide show

README.md CHANGED Viewed

@@ -17,14 +17,14 @@ model-index:
       type: LunarLander-v2
     metrics:
     - type: mean_reward
-      value: -240.31 +/- 86.45
       name: mean_reward
       verified: false
 ---
 # PPO Agent Playing LunarLander-v2
       This is a trained model of a PPO agent playing LunarLander-v2.
       ## Evaluation Results
-      - Mean Reward: -240.31 ± 86.45
       - Number of Evaluation Episodes: 10
       ## Hyperparameters
       ```python

       type: LunarLander-v2
     metrics:
     - type: mean_reward
+      value: -181.63 +/- 99.00
       name: mean_reward
       verified: false
 ---
 # PPO Agent Playing LunarLander-v2
       This is a trained model of a PPO agent playing LunarLander-v2.
       ## Evaluation Results
+      - Mean Reward: -181.63 ± 99.00
       - Number of Evaluation Episodes: 10
       ## Hyperparameters
       ```python

logs/events.out.tfevents.1750046388.2f208e49a865 ADDED Viewed

File without changes

results.json CHANGED Viewed

	@@ -1 +1 @@
1	- {"env_id": "LunarLander-v2", "mean_reward": -~~240~~.~~31012056393024~~, "std_reward": 86.~~45368985234037~~, "n_evaluation_episodes": 10, "eval_datetime": "2025-06-~~16T03~~:54:29.~~082807~~"}


1	+ {"env_id": "LunarLander-v2", "mean_reward": -181.6324442168095, "std_reward": 98.99931583924595, "n_evaluation_episodes": 10, "eval_datetime": "2025-06-16T04:00:33.568917"}