Models

3,194

Full-text search

Active filters: ppo

CatkinChen/nethack-ppo-ablation-no_hmm_rnd

Reinforcement Learning • Updated Sep 27, 2025

CatkinChen/nethack-ppo-ablation-baseline_curiosity_dyn_only

Reinforcement Learning • Updated Sep 28, 2025

joigalcar/ppo-LunarLander-v2_Scratch

Reinforcement Learning • Updated Sep 23, 2025

joigalcar/ppo-LunarLander-v2_Scratch_2

Reinforcement Learning • Updated Sep 23, 2025

rishiad/kinitro-metaworld-agent

Reinforcement Learning • Updated Oct 25, 2025

CatkinChen/nethack-ppo-ablation-baseline_rnd

Reinforcement Learning • Updated Sep 28, 2025

CatkinChen/nethack-ppo-ablation-baseline_curiosity_skill_only

Reinforcement Learning • Updated Sep 27, 2025

CatkinChen/nethack-ppo-ablation-baseline_curiosity_trans_only

Reinforcement Learning • Updated Sep 27, 2025

OxoGhost/ppo-LunarLander-v2-PPO

Reinforcement Learning • Updated Sep 23, 2025

WillLedd/ppoCartPoleFromScratch

Reinforcement Learning • Updated Sep 23, 2025

nabeelshan/rlhf-gpt2-pipeline

Text Generation • Updated Sep 24, 2025

CatkinChen/nethack-ppo-ablation-baseline_full_curiosity

Reinforcement Learning • Updated Sep 28, 2025

WillLedd/PPO-CleanRL-LunarLander-v2

Reinforcement Learning • Updated Sep 24, 2025

tstenborg/unit8-LunarLander-v2

Reinforcement Learning • Updated Sep 24, 2025

timflash/ppo-LunarLander-v2

Reinforcement Learning • Updated Sep 26, 2025

forgedRice/ppo-LunarLander-v2

Reinforcement Learning • Updated Sep 27, 2025 • 1

forgedRice/drl-course-unit-01-lunar-lander-v2

Reinforcement Learning • Updated Sep 27, 2025 • 1

user05181824/ppo-LunarLander-v3

Reinforcement Learning • Updated Sep 29, 2025

Tanaybh/gpt2-got-therapy

Text Generation • 0.1B • Updated Sep 30, 2025 • 1 • 1

ricardo-teixeira9/ppo-LunarLander-v2_unit8

Reinforcement Learning • Updated Sep 30, 2025

Bavantha11/LunarLander-v2-unit8

Reinforcement Learning • Updated Oct 1, 2025

Vibudhbh/gpt2-rlhf-implementation

Text Generation • 0.1B • Updated Oct 2, 2025 • 6

ginnigarg/ginni-ppo-LunarLander-v2

Reinforcement Learning • Updated Feb 9

mradermacher/gpt2-rlhf-implementation-GGUF

0.1B • Updated Oct 2, 2025 • 127

chenyu0x00/ppo-unit8-LunarLander-v2

Reinforcement Learning • Updated Oct 4, 2025

Sharath-25/ppo-from-scratch

Reinforcement Learning • Updated Oct 5, 2025

granenko/ppo-LunarLander-v3

Reinforcement Learning • Updated Oct 5, 2025

MrOceanMan/ppo-LunarLander-v2

Reinforcement Learning • Updated Oct 7, 2025

haris9873/LunarLander-v2

Reinforcement Learning • Updated Oct 8, 2025

Aubins/CustomPPO-LunarLander-v2

Reinforcement Learning • Updated Oct 9, 2025