Edit Models filters

Models

3,279

Base only

Active filters: ppo

ishadyaAP/LunarLander-v2-8

Reinforcement Learning • Updated Dec 18, 2025

beachcities/ppo-BipedalWalker-v3-A100-SOTA

Reinforcement Learning • Updated Dec 19, 2025 • 3

dimgalli/ppo-LunarLander

Reinforcement Learning • Updated Dec 19, 2025

DhruvJalan/ppo-LunarLander-v2

Reinforcement Learning • Updated Dec 19, 2025

mahir05/ppo-LunarLander-v2-unit8

Reinforcement Learning • Updated Dec 20, 2025

kapilw25/llama3-8b-pku-PPO-NoInstruct-SFT-NoInstruct

Updated Dec 20, 2025

kapilw25/llama3-8b-pku-PPO-Instruct-SFT-Instruct

Updated Dec 21, 2025

elusivephantasm/ppo-cr-LunarLander-v2

Reinforcement Learning • Updated Dec 21, 2025

elusivephantasm/ppo-cr-LunarLander-v2-unit8_part1

Reinforcement Learning • Updated Dec 21, 2025

aryannzzz/ppo-lunarlander-scratch

Reinforcement Learning • Updated Dec 21, 2025

Michellemingxuan/ppo-scratch-LunarLander-v3

Reinforcement Learning • Updated Dec 22, 2025

KnoY/LunarLander-v2-ppo

Reinforcement Learning • Updated Dec 23, 2025

mohamednabil500/ppo-space-invaders-10M-expert

Reinforcement Learning • Updated Dec 25, 2025 • 1

thisusernameisnotavailablehee/ppo-huggy

Reinforcement Learning • Updated Dec 25, 2025

Tasfiya025/Neuroscience_EEG_Epilepsy_Tagger

Reinforcement Learning • Updated Dec 26, 2025 • 4

Haxxsh/micppo-LunarLander-v2-unit8-part1

Reinforcement Learning • Updated Dec 27, 2025

Emptier8126/ppo-LunarLander-v3

Reinforcement Learning • Updated Dec 30, 2025

ketencrypt10n/ppo-lunar-lander

Reinforcement Learning • Updated Dec 31, 2025 • 1

seynath/LunarLander-v2

Reinforcement Learning • Updated Jan 1 • 2

phuongntc/llama32_1b_ppo_noSFT_multievalsumviet2_penalty

Reinforcement Learning • Updated Jan 1

HumanPlane/LACUNA

Reinforcement Learning • 38.8k • Updated Jan 1 • 4 • 7

TensorAeroSpace/ppo-b747-step-response

Reinforcement Learning • Updated Jan 2 • 24

rashidi1saeed/ppo-LunarLander-v3-cleanRL

Reinforcement Learning • Updated Jan 2

rashidi1saeed/ppo-LunarLander-v2-cleanRL

Reinforcement Learning • Updated Jan 2

kostas-c/LunarLander-v2

Reinforcement Learning • Updated Jan 2

bhxvxsh/recipeai-ultra-performance

Reinforcement Learning • Updated Jan 2 • 4

johnx4321/LLV2

Reinforcement Learning • Updated Jan 2

mmichiels13/ppo-CartPole-v1

Reinforcement Learning • Updated Jan 3

mmichiels13/ppo-scratch-LunarLander-v2

Reinforcement Learning • Updated Jan 3

LeonardoMdSA/PPO-CleanRL-LunarLander-v2

Reinforcement Learning • Updated Jan 3