sam133
/

ppo-LunarLander-v2

Reinforcement Learning

stable-baselines3

deep-reinforcement-learning

Eval Results (legacy)

Model card Files Files and versions

ppo-LunarLander-v2

493 kB

Ctrl+K

Ctrl+K

1 contributor

History: 2 commits

sam133's picture

Model trained for 10 million timesteps with mean_reward=286.17

f923604 over 3 years ago