Edit Models filters

Models

3,301

Base only

Active filters: ppo

eseskay/ppo-LunarLander-v2-unit8-p1

Reinforcement Learning • Updated Jul 17, 2024

Milad-R/ppo-CartPole-v1

Reinforcement Learning • Updated Jul 18, 2024

Soorya1998/ppo-CartPole-v3

Reinforcement Learning • Updated Jul 18, 2024

lockylocks/PPO_LunarLander-v2

Reinforcement Learning • Updated Jul 18, 2024

Yash-Shindey/ppo-CartPole-v1

Reinforcement Learning • Updated Jul 20, 2024

Yash-Shindey/ppo-LunarLander

Reinforcement Learning • Updated Jul 20, 2024

Adignite/llama2_ppo_lawrl_epoch1

Reinforcement Learning • 7B • Updated Jul 22, 2024 • 2

thomaspalomares/unit8-ppo

Reinforcement Learning • Updated Jul 24, 2024

colinrgodsey/rl_course_vizdoom_health_gathering_supreme

Reinforcement Learning • Updated Aug 3, 2024

rishisim/ppo-LunarLander-v2-unit8-p1

Reinforcement Learning • Updated Jul 25, 2024

gabrielloiseau/TAROT-PPO

Text Generation • 0.4B • Updated Sep 5, 2024 • 9 • 1

jvelja/ppo-gemma-2b-epoch-1

Reinforcement Learning • Updated Jul 25, 2024

jvelja/ppo-gemma-2b-epoch-11

Reinforcement Learning • Updated Jul 25, 2024 • 1

jvelja/ppo-gemma-2b-epoch-21

Reinforcement Learning • Updated Jul 25, 2024 • 1

jvelja/ppo-gemma-2b-epoch-41

Reinforcement Learning • Updated Jul 25, 2024 • 1

jvelja/ppo-gemma-2b-epoch-51

Reinforcement Learning • Updated Jul 25, 2024 • 1

jvelja/ppo-gemma-2b-epoch-61

Reinforcement Learning • Updated Jul 25, 2024

jvelja/ppo-gemma-2b-epoch-71

Reinforcement Learning • Updated Jul 25, 2024 • 1

jvelja/ppo-gemma-2b-epoch-81

Reinforcement Learning • Updated Jul 25, 2024 • 5

jvelja/ppo-distilbert-base-uncased-epoch-0

Reinforcement Learning • Updated Jul 26, 2024 • 2

jvelja/ppo-distilbert-base-uncased-epoch-10

Reinforcement Learning • Updated Jul 26, 2024 • 1

jvelja/ppo-distilbert-base-uncased-epoch-20

Reinforcement Learning • Updated Jul 26, 2024 • 2

jvelja/ppo-distilbert-base-uncased-epoch-30

Reinforcement Learning • Updated Jul 26, 2024 • 2

jvelja/ppo-distilbert-base-uncased-epoch-40

Reinforcement Learning • Updated Jul 26, 2024 • 1

yhyeo0202/ppo-LunarLander-v2

Reinforcement Learning • Updated Sep 19, 2024 • 2

jvelja/ppo-gpt2-epoch-0

Reinforcement Learning • 0.1B • Updated Jul 26, 2024

jvelja/ppo-gpt2-epoch-10

Reinforcement Learning • 0.1B • Updated Jul 26, 2024

jvelja/ppo-gpt2-epoch-20

Reinforcement Learning • 0.1B • Updated Jul 26, 2024 • 1

jvelja/ppo-gpt2-epoch-30

Reinforcement Learning • 0.1B • Updated Jul 26, 2024 • 1

jvelja/ppo-gpt2-epoch-40

Reinforcement Learning • 0.1B • Updated Jul 26, 2024 • 2