Models

3,197

Full-text search

Active filters: ppo

malifnasrulloh/PPO-IndoNanoT5-base-Liputan6-Canonical

Reinforcement Learning • 0.2B • Updated Apr 15, 2025

TAS-Theo/ppo-CartPole-v1-v2

Reinforcement Learning • Updated Apr 16, 2025

gyaan/ppo-from-scratch-LunarLander-v2-distilled

Reinforcement Learning • Updated Apr 19, 2025

Synthcite24/ppo_final_done

Reinforcement Learning • Updated Apr 19, 2025

fengyang0317/ppo-CartPole-v1

Reinforcement Learning • Updated Apr 20, 2025

opria123/custom-ppo-lunar-lander-v2

Reinforcement Learning • Updated Apr 21, 2025

Paulcvbg/ppo-CartPole-v1

Reinforcement Learning • Updated Apr 22, 2025

ezrab/ppo-LunarLander-v2-unit8

Reinforcement Learning • Updated Apr 23, 2025

ezrab/ppo-LunarLander-v2-unit8-1

Reinforcement Learning • Updated Apr 24, 2025

gyaan/ppo-LunarLander-v2-again

Reinforcement Learning • Updated Apr 24, 2025

gyaan/ppo-LunarLander-v2-again-distilled

Reinforcement Learning • Updated Apr 24, 2025

hubertau/ppo-lunarlander-cleanrl

Reinforcement Learning • Updated Apr 24, 2025

ezrab/ppo-LunarLander-v2-unit8-2

Reinforcement Learning • Updated Apr 24, 2025

ezrab/ppo-LunarLander-v2-unit8-3

Reinforcement Learning • Updated Apr 24, 2025

s94lopez/NewLunarLander

Reinforcement Learning • Updated Apr 26, 2025

ikerm11/gemma1b_humanizer_lora

Reinforcement Learning • Updated Apr 27, 2025

tensorblock/MoxoffSrL_Moxoff-Phi3Mini-PPO-GGUF

4B • Updated Jan 27 • 8

ranranrunforit/pi-LunarLander-v2

Reinforcement Learning • Updated Apr 28, 2025

DumbleDuck/ppo-LunarLander-v2-scratch

Reinforcement Learning • Updated Apr 30, 2025

Anish13/ppo-LunarLander

Reinforcement Learning • Updated Apr 30, 2025

evgenyz/ppo-CartPole-v1-cleanRL

Reinforcement Learning • Updated May 1, 2025

PR0G3T/LunarLander-v2

Reinforcement Learning • Updated May 1, 2025

qys271828/Testppo

Reinforcement Learning • Updated May 2, 2025

Elahe96/LunarLander-v2

Reinforcement Learning • Updated May 2, 2025

westy412/ppo-LunarLander-v1-u8

Reinforcement Learning • Updated May 3, 2025

jlse/ppo-LunarLander-v2-u8

Reinforcement Learning • Updated May 4, 2025

ajagota71/pythia-70m-detox-test

Reinforcement Learning • 70.4M • Updated May 4, 2025 • 1

Momin-Shahzad/ppo-CartPole-v1

Reinforcement Learning • Updated May 4, 2025

ajagota71/pythia-70m-detox-raw-logits

Reinforcement Learning • 70.4M • Updated May 4, 2025 • 1

Momin-Shahzad/LunarLander-v2

Reinforcement Learning • Updated May 4, 2025