Edit Models filters

Models

3,294

Base only

Active filters: ppo

Phani0404/PPO

Reinforcement Learning • Updated Mar 24, 2025

rebeccavfweiss/ppo-CartPole-v1

Reinforcement Learning • Updated Mar 24, 2025

rebeccavfweiss/ppo-LunarLandar-v2

Reinforcement Learning • Updated Mar 24, 2025

mirikle/ppo-LunarLander-v2

Reinforcement Learning • Updated Apr 19, 2025 • 2

mikewzp/PPO_LL-v2

Reinforcement Learning • Updated Mar 25, 2025

S-Chaves/ppo-LunarLander-v2

Reinforcement Learning • Updated May 13, 2025 • 1

nakato-nk/PPO-CartPole-V1

Reinforcement Learning • Updated Mar 26, 2025

nakato-nk/LunarLander-v2-PPO

Reinforcement Learning • Updated Mar 26, 2025

togu6669/ppo-CartPole-v1

Reinforcement Learning • Updated Mar 28, 2025

liuhailin0123/llm-course-hw2-ppo

Text Generation • 0.1B • Updated Mar 30, 2025 • 5

stalaei/DeepRL-ppo-LunarLander-v2

Reinforcement Learning • Updated Mar 29, 2025 • 2

hnj0022/ppo-CartPole-v1

Reinforcement Learning • Updated Mar 27, 2025

eugeneseo/ppo-CartPole-v1-unit8

Reinforcement Learning • Updated Mar 27, 2025

hnj0022/myppo-LunarLander-v2-unit8_part1

Reinforcement Learning • Updated Mar 27, 2025

tzwilliam0/maxmin-dpo-init-kl-coef-0.1-rebuttal-dongnan

Reinforcement Learning • Updated Mar 27, 2025 • 1

figurek1m/ppo-LunarLander-v2-unit8

Reinforcement Learning • Updated Mar 27, 2025

tzwilliam0/maxmin-dpo-init-kl-coef-0.5-rebuttal-dongnan

Reinforcement Learning • Updated Mar 27, 2025 • 1

lucasschott/Enduro-v5-PPO

Reinforcement Learning • 2.24M • Updated Apr 7, 2025 • 2

xinyuema/llm-course-hw2-ppo

Text Generation • 0.1B • Updated Mar 28, 2025 • 3

stalaei/DeepRL-ppo-LunarLander-v2-scratch

Reinforcement Learning • Updated Mar 29, 2025

Krazeder/unit8-LunarLander-v2-ppo

Reinforcement Learning • Updated Mar 29, 2025

RL-Learn/ppo-LunarLander-v2-fromscratch

Reinforcement Learning • Updated Mar 30, 2025

J-Raposo/ppo-hand-CartPole-v2

Reinforcement Learning • Updated Mar 30, 2025

BigSmiley7/LunarLander-v2_unit8

Reinforcement Learning • Updated Mar 31, 2025

BigSmiley7/ppo-CartPole-v1

Reinforcement Learning • Updated Mar 31, 2025

Dimba777/ppo-CartPole-v1

Reinforcement Learning • Updated Apr 2, 2025

Haricot24601/ppo-LunarLander-v2-2

Reinforcement Learning • Updated Apr 2, 2025

Haricot24601/ppo-Lunarlander-v2-3

Reinforcement Learning • Updated Apr 2, 2025

Jenny55533/pp0

Reinforcement Learning • Updated Apr 3, 2025

JLTastet/ppo-LunarLander-v2-cleanRL

Reinforcement Learning • Updated Apr 5, 2025