mischievers
/

openfront-rl-agent

@@ -22,15 +22,15 @@ PPO-trained agent for [OpenFront.io](https://openfront.io), a multiplayer territ
 - **Parallel envs:** 8
 - **Learning rate:** 0.0002
 - **Rollout steps:** 512
-- **Updates trained:** 1400
-- **Global steps:** 5734400
 - **Best mean reward:** 468.54246531009676
 ## Final Training Metrics
-- **Mean reward:** 178.37687824249267
-- **Mean episode length:** 6926.31
-- **Loss:** 0.08463311195373535
 ## Usage

 - **Parallel envs:** 8
 - **Learning rate:** 0.0002
 - **Rollout steps:** 512
+- **Updates trained:** 1650
+- **Global steps:** 6758400
 - **Best mean reward:** 468.54246531009676
 ## Final Training Metrics
+- **Mean reward:** 231.36178754091262
+- **Mean episode length:** 6722.13
+- **Loss:** 1.217943549156189
 ## Usage