Edit Models filters

Models

3,281

Base only

Active filters: ppo

OxoGhost/ppo-LunarLander-v2-PPO

Reinforcement Learning • Updated Sep 23, 2025

WillLedd/ppoCartPoleFromScratch

Reinforcement Learning • Updated Sep 23, 2025

nabeelshan/rlhf-gpt2-pipeline

Text Generation • Updated Sep 24, 2025

CatkinChen/nethack-ppo-ablation-baseline_full_curiosity

Reinforcement Learning • Updated Sep 28, 2025

WillLedd/PPO-CleanRL-LunarLander-v2

Reinforcement Learning • Updated Sep 24, 2025

tstenborg/unit8-LunarLander-v2

Reinforcement Learning • Updated Sep 24, 2025

timflash/ppo-LunarLander-v2

Reinforcement Learning • Updated Sep 26, 2025

forgedRice/ppo-LunarLander-v2

Reinforcement Learning • Updated Sep 27, 2025 • 1

forgedRice/drl-course-unit-01-lunar-lander-v2

Reinforcement Learning • Updated Sep 27, 2025 • 2

user05181824/ppo-LunarLander-v3

Reinforcement Learning • Updated Sep 29, 2025

Tanaybh/gpt2-got-therapy

Text Generation • 0.1B • Updated Sep 30, 2025 • 4 • 1

ricardo-teixeira9/ppo-LunarLander-v2_unit8

Reinforcement Learning • Updated Sep 30, 2025

Bavantha11/LunarLander-v2-unit8

Reinforcement Learning • Updated Oct 1, 2025

Vibudhbh/gpt2-rlhf-implementation

Text Generation • 0.1B • Updated Oct 2, 2025 • 4

ginnigarg/ginni-ppo-LunarLander-v2

Reinforcement Learning • Updated Feb 9

mradermacher/gpt2-rlhf-implementation-GGUF

0.1B • Updated Oct 2, 2025 • 103

chenyu0x00/ppo-unit8-LunarLander-v2

Reinforcement Learning • Updated Oct 4, 2025

Sharath-25/ppo-from-scratch

Reinforcement Learning • Updated Oct 5, 2025

granenko/ppo-LunarLander-v3

Reinforcement Learning • Updated Oct 5, 2025

MrOceanMan/ppo-LunarLander-v2

Reinforcement Learning • Updated Oct 7, 2025

haris9873/LunarLander-v2

Reinforcement Learning • Updated Oct 8, 2025

Aubins/CustomPPO-LunarLander-v2

Reinforcement Learning • Updated Oct 9, 2025

daishan986/ppo-CartPole-v1

Reinforcement Learning • Updated Oct 11, 2025

daishan986/ppo-LunarLander-v2

Reinforcement Learning • Updated Oct 11, 2025

Zybg/ppo-Huggy

Updated Oct 12, 2025

PhuQuy23TNT1/ppo_lunarlander_unit8

Reinforcement Learning • Updated Oct 13, 2025

chisboiz111/ppo-lunar-lander-unit8

Reinforcement Learning • Updated Oct 13, 2025

AngelaHoa23/ppo-lunar-lander-unit8

Reinforcement Learning • Updated Oct 13, 2025

duyminh12122005/ppo-lunar-lander-unit8

Reinforcement Learning • Updated Oct 13, 2025

elliemci/ppo-LunarLander-v2-cleanRL

Reinforcement Learning • Updated Oct 27, 2025