Edit Models filters

Models

3,299

Base only

Active filters: ppo

kismet163/ppo-LunarLander-v2

Reinforcement Learning • Updated Dec 24, 2024

kismet163/PPO-RL

Reinforcement Learning • Updated Dec 24, 2024

ZhaoxiZheng/ppo-LunarLander-v2-unit8-part1

Reinforcement Learning • Updated Dec 25, 2024

Snorlax/LunarLander-v2-PPO-reproduce

Reinforcement Learning • Updated Dec 27, 2024

mjkim0928/ppo-LunarLander-v2

Reinforcement Learning • Updated Feb 17, 2025 • 1

earlzero/LunarLander-CleanRL

Reinforcement Learning • Updated Dec 28, 2024

qbbian/ppo-CartPole-ppo

Reinforcement Learning • Updated Dec 28, 2024

csabazs/LunarLanderCustom

Reinforcement Learning • Updated Dec 28, 2024

Atmond/ppo-CartPole-v1

Reinforcement Learning • Updated Dec 28, 2024

AneeshSinha/ppo-lunar-lander-v3

Reinforcement Learning • Updated Dec 29, 2024

sErial03/ppo-LunarLander-v2

Reinforcement Learning • Updated Jan 9, 2025 • 1

Fangliuwh/ppo-CartPole-v1

Reinforcement Learning • Updated Dec 29, 2024

Fangliuwh/LunarLander-v2-ppo-cleanrl

Reinforcement Learning • Updated Dec 29, 2024

LunaMeme/LunarLander-PPO-v2

Reinforcement Learning • Updated Dec 31, 2024

wirthy21/rl2v2unit8_ppo-CartPole-v1

Reinforcement Learning • Updated Jan 2, 2025

mgoksu/LunarLander-v2

Reinforcement Learning • Updated Jan 2, 2025

spenning/ppo-LunarLander-v2_1

Reinforcement Learning • Updated Jan 4, 2025

tzwilliam0/maxmin-dpo-init-kl-coef-0.5-fix-lora-dongnan

Reinforcement Learning • Updated Jan 4, 2025

tzwilliam0/maxmin-dpo-init-kl-coef-0.1-fix-lora-dongnan

Reinforcement Learning • Updated Jan 4, 2025 • 1

mradermacher/Moxoff-Phi3Mini-PPO-GGUF

4B • Updated Jan 13, 2025 • 65

mradermacher/Moxoff-Phi3Mini-PPO-i1-GGUF

4B • Updated Jan 13, 2025 • 34

NBKi/ppoU8-LunarLander

Reinforcement Learning • Updated Jan 6, 2025

DisposableTmep/PPO-CleanRL-LunarLander-v2

Reinforcement Learning • Updated Jan 7, 2025

davidgaofc/POISON_PPO_base

Reinforcement Learning • 60.5M • Updated Jan 9, 2025 • 2

davidgaofc/POISON_PPO_0.3

Reinforcement Learning • 60.5M • Updated Jan 9, 2025

davidgaofc/POISON_PPO_0.4

Reinforcement Learning • 60.5M • Updated Jan 9, 2025 • 1

davidgaofc/POISON_PPO_0.5

Reinforcement Learning • 60.5M • Updated Jan 9, 2025 • 1

Stoub/ppo2-LunarLander-v2

Reinforcement Learning • Updated Jan 10, 2025

tzwilliam0/maxmin-dpo-init-kl-coef-0.1-fix-reward-norm-dongnan

Reinforcement Learning • Updated Jan 10, 2025 • 1

tzwilliam0/maxmin-dpo-init-kl-coef-0.5-fix-reward-norm-dongnan

Reinforcement Learning • Updated Jan 10, 2025 • 1