Edit Models filters

Models

3,301

Base only

Active filters: ppo

Noel-lawrence/ppo-CartPole-v1

Reinforcement Learning • Updated Aug 5, 2024

rabhishek100/ppo-CartPole-v1

Reinforcement Learning • Updated Aug 6, 2024

colinrgodsey/vizdoom_deathmatch

Reinforcement Learning • Updated Aug 19, 2024

minht57/ppo-scratch-CartPole-v1

Reinforcement Learning • Updated Aug 6, 2024

jvelja/ppo-gpt2-imdb-epoch-1000

Reinforcement Learning • 0.1B • Updated Aug 7, 2024 • 1

jvelja/ppo-gemma-2-2b-epoch-1000

Reinforcement Learning • Updated Aug 8, 2024

maavaneck/cppo-LunarLander-v2

Reinforcement Learning • Updated Oct 1, 2024

Pengcheng-Wang/ppo-LunarLander-v3

Reinforcement Learning • Updated Aug 9, 2024

mliubimov/ppo-CartPole-v1

Reinforcement Learning • Updated Aug 10, 2024

estrada1/LunarLander-v2

Reinforcement Learning • Updated Aug 12, 2024

jvelja/ppo-gpt2-imdb-epoch-123123

Reinforcement Learning • 0.1B • Updated Aug 12, 2024

jvelja/ppo-gpt2-imdb-epoch-1

Reinforcement Learning • 0.1B • Updated Aug 12, 2024

jvelja/ppo-ppo-gpt2-imdb-epoch-123123-epoch-123123

Reinforcement Learning • 0.1B • Updated Aug 12, 2024 • 1

jvelja/ppo-ppo-gpt2-imdb-epoch-1-epoch-3

Reinforcement Learning • 0.1B • Updated Aug 12, 2024

jvelja/ppo-ppo-ppo-gpt2-imdb-epoch-123123-epoch-123123-epoch-123123123

Reinforcement Learning • 0.1B • Updated Aug 12, 2024

jvelja/ppo-gemma-2-2b-epoch-6667

Reinforcement Learning • Updated Aug 12, 2024

ymath/ppo-gemma-2-2b-it-epoch-2

Reinforcement Learning • Updated Aug 13, 2024 • 2

Emericzhito/LunarLander-v33

Reinforcement Learning • Updated Aug 14, 2024

ToonAga/ppo-CartPole-v1

Reinforcement Learning • Updated Aug 15, 2024

ToonAga/Lunar_lander_PPO-v1

Reinforcement Learning • Updated Aug 15, 2024

ToonAga/Lunar_lander_PPO-v2

Reinforcement Learning • Updated Aug 15, 2024

ymath/ppo-gemma-2-2b-it-epoch-1

Reinforcement Learning • Updated Aug 15, 2024 • 1

ymath/ppo-gemma-2-2b-it-epoch-1000

Reinforcement Learning • Updated Aug 15, 2024 • 3

nguyenduchuyiu/ppo-CartPole-v1-from-scratch

Reinforcement Learning • Updated Aug 15, 2024

jvelja/ppo-gpt2-epoch-777778

Reinforcement Learning • 0.1B • Updated Aug 15, 2024

jimjiang203/ppo-LunarLander-v2

Reinforcement Learning • Updated Aug 16, 2024

knight9114/ppo-LunarLander-v2-unit8.1

Reinforcement Learning • Updated Aug 16, 2024

jvelja/ppo-gemma-2-2b-it-epoch-1.01

Reinforcement Learning • Updated Aug 16, 2024

GeorgeImmanuel/ppo_practice

Reinforcement Learning • Updated Aug 16, 2024

davidgaofc/revision_PPO0.5

Reinforcement Learning • 60.5M • Updated Aug 17, 2024 • 1