Suprim003
/

ppo-LunarLanger-v2

Reinforcement Learning

stable-baselines3

LunarLander-v2

deep-reinforcement-learning

Eval Results (legacy)

Model card Files Files and versions

xet

Community

ppo-LunarLanger-v2 / results.json

Suprim003

Trained LumarLanger-v2 model with PPO

912181d verified 10 months ago

raw

history blame contribute delete

156 Bytes

{"mean_reward": 253.2969367, "std_reward": 19.7052094885131, "is_deterministic": true, "n_eval_episodes": 10, "eval_datetime": "2025-07-15T06:18:01.362935"}