Models

3,200

Full-text search

Active filters: ppo

Khushal31/ppo-Unit8-LunarLander-v2

Reinforcement Learning • Updated Mar 6, 2025

suneater175/CleanRL-LunarLander-v2

Reinforcement Learning • Updated Mar 8, 2025

zhangtemplar/LunarLander-v2-newppo

Reinforcement Learning • Updated Mar 10, 2025

guife33/ppo-CartPole-v1

Reinforcement Learning • Updated Mar 10, 2025

guife33/LunarLander-v2

Reinforcement Learning • Updated Mar 10, 2025

so7en/Lunar_Lander_unit8

Reinforcement Learning • Updated Mar 12, 2025

pdimas/helpfulpharmacyllm_js-rlhf-01

Reinforcement Learning • 1B • Updated Mar 11, 2025 • 2

pdimas/helpfulpharmacyllm_mb-rlhf-01

Reinforcement Learning • 1B • Updated Mar 11, 2025 • 3

yhuanghamu/deep-rl-ppo-1

Reinforcement Learning • Updated Mar 12, 2025

udonhef2bmad/U8P1-ppo-LunarLander-v2

Reinforcement Learning • Updated Mar 12, 2025

jonathansculley/ppo-LunarLander-v3

Reinforcement Learning • Updated Mar 13, 2025

tmoroder/ppo-CartPole-v1

Reinforcement Learning • Updated Mar 14, 2025

tmoroder/manual-ppo-LunarLander-v2

Reinforcement Learning • Updated Mar 14, 2025

nossie0360/clean-ppo-LunarLander-v2

Reinforcement Learning • Updated Mar 14, 2025

AntonVoronko/ppo-fs-LunarLander-v2

Reinforcement Learning • Updated Mar 14, 2025

ALEXIOSTER/ppo-CartPole-v1

Reinforcement Learning • Updated Mar 14, 2025

ALEXIOSTER/ppo-LunarLander-v2

Reinforcement Learning • Updated Mar 14, 2025

ALEXIOSTER/ppo-LLV2

Reinforcement Learning • Updated Mar 14, 2025

maxhykw/ppo-CartPole-v1

Reinforcement Learning • Updated Mar 15, 2025

maxhykw/New_LunarLander-v2

Reinforcement Learning • Updated Mar 15, 2025

maxhykw/ppo-New_LunarLander-v2

Reinforcement Learning • Updated Mar 15, 2025

kelvinksau/ppo-CartPole-v1

Reinforcement Learning • Updated Mar 17, 2025

AGuzhvenko/ppo-CartPole-v1

Reinforcement Learning • Updated Mar 19, 2025

alexsung/ppo-CartPole-v1

Reinforcement Learning • Updated Mar 17, 2025

zimka/HFRLC_U8_ppo_CartPole

Reinforcement Learning • Updated Mar 18, 2025

Simple-Chop/ppo-Lunar-LanderV2

Reinforcement Learning • Updated Mar 18, 2025

wlchee/ppo-CartPole-v1

Reinforcement Learning • Updated Mar 20, 2025

AndVilches/LunarLander-v2

Reinforcement Learning • Updated Mar 21, 2025

Slyne/LunarLander-v2

Reinforcement Learning • Updated Mar 20, 2025

salym/PPO-CleanRL-LunarLander-v2

Reinforcement Learning • Updated Mar 20, 2025