Tass-k
/

ppo-LunarLander-v2

Reinforcement Learning

deep-reinforcement-learning

custom-implementation

Eval Results (legacy)

Model card Files Files and versions

PPO Agent Playing LunarLander-v2

This is a trained model of a PPO agent playing LunarLander-v2.

Mean Reward

13.46 +/- 125.62

Hyperparameters

{'env_id': 'LunarLander-v2', 'repo_id': 'Tass-k/ppo-LunarLander-v2'}

Downloads last month: -

Video Preview

Reinforcement Learning

loading

Evaluation results

mean_reward on LunarLander-v2
self-reported

13.46 +/- 125.62