Trained lunar lander with 1e6 timesteps using PPO from stable-baselines3

1e8cee0 over 2 years ago

157 Bytes

{"mean_reward": 256.6506172, "std_reward": 38.49037601453702, "is_deterministic": true, "n_eval_episodes": 10, "eval_datetime": "2023-06-17T13:43:18.114560"}