sigma-bit-dot
/

deep-rl-course

Reinforcement Learning

stable-baselines3

LunarLander-v2

deep-reinforcement-learning

Eval Results (legacy)

Model card Files Files and versions

xet

Community

deep-rl-course / results.json

sigma-bit-dot

train ppo model with 1,000,000 time steps

6f66be1 about 2 years ago

raw

history blame contribute delete

157 Bytes

{"mean_reward": 215.0883739, "std_reward": 79.88212942634392, "is_deterministic": true, "n_eval_episodes": 10, "eval_datetime": "2023-12-11T23:17:08.579406"}