Models

3,197

Full-text search

Active filters: ppo

gabrielbo/spark-model-QLoRA

Text Generation • Updated May 24, 2025 • 1

aarifahullah/LunarLander-v2_CleanRL

Reinforcement Learning • Updated May 24, 2025

kjamesh/ppo-CartPole-v1

Reinforcement Learning • Updated May 24, 2025

kjamesh/ppo-custom-LunarLander-v2

Reinforcement Learning • Updated May 24, 2025

wowthecoder/customPPO-LunarLander-v2

Reinforcement Learning • Updated May 25, 2025

cheetahbooked/lunar-lander-custom-ppo

Reinforcement Learning • Updated May 25, 2025

jegeblad/ppo-Lunar

Reinforcement Learning • Updated May 26, 2025

lmcastanedame/ppo-LunarLander-v2

Reinforcement Learning • Updated Jun 4, 2025 • 3

samcomber/lunar-lander-torch-ppo

Reinforcement Learning • Updated May 28, 2025

samcomber/ppo-cartpole

Reinforcement Learning • Updated May 28, 2025

nbzy1995/LunarLander-v2-scratch

Reinforcement Learning • Updated May 31, 2025

Akchunks/ppo-LunarLander-v2

Reinforcement Learning • Updated Jun 1, 2025

Saskaruza/ppo-LunarLander-v2

Reinforcement Learning • Updated Jun 11, 2025 • 3

mvyboh/HF-RL-Course-ppo-LunarLander-v2-Clean-RL

Reinforcement Learning • Updated Jun 3, 2025

ashani/ppo-CartPole-v1

Reinforcement Learning • Updated Jun 5, 2025

ashani/LunarLander-v2

Reinforcement Learning • Updated Jun 5, 2025

Adriano26/ppo.py

Reinforcement Learning • Updated Jun 7, 2025

GiovannaMariotto/PPO-CartPole-v1

Reinforcement Learning • Updated Jun 7, 2025

George067/ppo-lunarlander-2

Reinforcement Learning • Updated Jun 8, 2025

mandell/LunarLander-v2

Reinforcement Learning • Updated Jun 9, 2025

Icarus013/ppo-LunarLander-v2-8.1

Reinforcement Learning • Updated Jun 9, 2025

cashmerepancake/ppo-LunarLander-v2

Reinforcement Learning • Updated Jun 16, 2025 • 3

Zhan1fen/ppo-LunarLander-v2

Reinforcement Learning • Updated Jun 10, 2025

Zhan1fen/ppo-LunarLander-v2-clip-coef0.2

Reinforcement Learning • Updated Jun 16, 2025

Zhan1fen/ppo-LunarLander-v2-clip-coef0.1

Reinforcement Learning • Updated Jun 16, 2025

Zhan1fen/ppo-LunarLander-v2-clip-coef0.3

Reinforcement Learning • Updated Jun 16, 2025

Zhan1fen/ppo-LunarLander-v2-clip-coef0.4

Reinforcement Learning • Updated Jun 16, 2025

Zhan1fen/ppo-LunarLander-v2-clip-coef0.05

Reinforcement Learning • Updated Jun 10, 2025

Zhan1fen/ppo-LunarLander-v2-clip-coef0.25

Reinforcement Learning • Updated Jun 16, 2025

PranayPalem/CleanRL_LunarLander-v2

Reinforcement Learning • Updated Jun 11, 2025