Edit Models filters

Models

3,294

Base only

Active filters: ppo

gyaan/ppo-LunarLander-v2-again

Reinforcement Learning • Updated Apr 24, 2025

gyaan/ppo-LunarLander-v2-again-distilled

Reinforcement Learning • Updated Apr 24, 2025

hubertau/ppo-lunarlander-cleanrl

Reinforcement Learning • Updated Apr 24, 2025

ezrab/ppo-LunarLander-v2-unit8-2

Reinforcement Learning • Updated Apr 24, 2025

ezrab/ppo-LunarLander-v2-unit8-3

Reinforcement Learning • Updated Apr 24, 2025

s94lopez/NewLunarLander

Reinforcement Learning • Updated Apr 26, 2025

ikerm11/gemma1b_humanizer_lora

Reinforcement Learning • Updated Apr 27, 2025 • 1 • 1

tensorblock/MoxoffSrL_Moxoff-Phi3Mini-PPO-GGUF

4B • Updated Jan 27 • 19

ranranrunforit/pi-LunarLander-v2

Reinforcement Learning • Updated Apr 28, 2025

DumbleDuck/ppo-LunarLander-v2-scratch

Reinforcement Learning • Updated Apr 30, 2025

Anish13/ppo-LunarLander

Reinforcement Learning • Updated Apr 30, 2025

evgenyz/ppo-CartPole-v1-cleanRL

Reinforcement Learning • Updated May 1, 2025

PR0G3T/LunarLander-v2

Reinforcement Learning • Updated May 1, 2025

qys271828/Testppo

Reinforcement Learning • Updated May 2, 2025

Elahe96/LunarLander-v2

Reinforcement Learning • Updated May 2, 2025

westy412/ppo-LunarLander-v1-u8

Reinforcement Learning • Updated May 3, 2025

jlse/ppo-LunarLander-v2-u8

Reinforcement Learning • Updated May 4, 2025

ajagota71/pythia-70m-detox-test

Reinforcement Learning • 70.4M • Updated May 4, 2025 • 2

Momin-Shahzad/ppo-CartPole-v1

Reinforcement Learning • Updated May 4, 2025

ajagota71/pythia-70m-detox-raw-logits

Reinforcement Learning • 70.4M • Updated May 4, 2025 • 3

Momin-Shahzad/LunarLander-v2

Reinforcement Learning • Updated May 4, 2025

Nack34/ppo-from-scratch-LunarLander-v2

Reinforcement Learning • Updated May 4, 2025

fedorl/unit8

Reinforcement Learning • Updated May 4, 2025

Ari8/ppo-LunarLander-v2_unit8

Reinforcement Learning • Updated May 7, 2025

AndreiVoicuT/ppo-LunarLander-v2-C8

Reinforcement Learning • Updated Jun 12, 2025

alejandroajhr/ppo-LunarLander-v2-unit8

Reinforcement Learning • Updated May 7, 2025

ajagota71/pythia-70m-detox-irl-rlhf-test

Reinforcement Learning • 70.4M • Updated May 7, 2025 • 8

rusuanjun/ppo-selfimplement-LunarLander-v2

Reinforcement Learning • Updated May 8, 2025

SpriteLi/LunarLander

Reinforcement Learning • Updated May 8, 2025

aalva/ppo-cleanrl-LunarLander-v2

Reinforcement Learning • Updated May 10, 2025