Edit Models filters

Models

3,301

Base only

Active filters: ppo

jvelja/ppo-gpt2-epoch-50

Reinforcement Learning • 0.1B • Updated Jul 26, 2024 • 1

jvelja/ppo-Meta-Llama-3.1-8B-epoch-0

Reinforcement Learning • Updated Jul 26, 2024 • 1

jvelja/ppo-Meta-Llama-3.1-8B-epoch-10

Reinforcement Learning • Updated Jul 26, 2024 • 1

jvelja/ppo-gemma-2b-epoch-0

Reinforcement Learning • Updated Jul 26, 2024

jvelja/ppo-gemma-2b-epoch-10

Reinforcement Learning • Updated Jul 26, 2024 • 9

jvelja/ppo-gemma-2b-epoch-20

Reinforcement Learning • Updated Jul 26, 2024 • 2

jvelja/ppo-gemma-2b-epoch-30

Reinforcement Learning • Updated Jul 26, 2024 • 2

jvelja/ppo-gemma-2b-epoch-40

Reinforcement Learning • Updated Jul 26, 2024 • 1

jvelja/ppo-gemma-2b-epoch-50

Reinforcement Learning • Updated Jul 26, 2024 • 3

jvelja/ppo-gemma-2b-epoch-60

Reinforcement Learning • Updated Jul 26, 2024 • 4

jvelja/ppo-gemma-2b-epoch-70

Reinforcement Learning • Updated Jul 26, 2024 • 5

jvelja/ppo-gemma-2b-epoch-80

Reinforcement Learning • Updated Jul 26, 2024 • 2

jvelja/ppo-gemma-2b-epoch-90

Reinforcement Learning • Updated Jul 26, 2024 • 4

SwarajRay/ppo-CartPole-v1-unit8

Reinforcement Learning • Updated Jul 27, 2024

hishamcse/mortal-kombat-3-ppo-diambra

Reinforcement Learning • Updated Aug 12, 2024 • 1

NeoCodes-dev/Unit8_part1_V1

Reinforcement Learning • Updated Jul 28, 2024

tcottone/LunarLander-v2-2

Reinforcement Learning • Updated Jul 30, 2024

ThNaToS/LunarLanderv2

Reinforcement Learning • Updated Jul 31, 2024

andriJulian/ppo-v2-sm

Reinforcement Learning • Updated Aug 1, 2024

bakermann/ppo-Lunar_v2

Reinforcement Learning • Updated Aug 2, 2024

execbat/ppo-LunarLander-v2-unit-8

Reinforcement Learning • Updated Aug 2, 2024

dogukankartal/ppo_pytorch_lunar_lander_v2

Reinforcement Learning • Updated Aug 3, 2024 • 1

davidkh/ppo-CartPole-v1

Reinforcement Learning • Updated Aug 4, 2024

dlarionov/ppo2-LunarLander-v2

Reinforcement Learning • Updated Aug 5, 2024

mashaal24/ppo-LunarLander-v2

Reinforcement Learning • Updated Aug 16, 2024

lawrl/llama2_ppo_lawrl_epoch1

Reinforcement Learning • 7B • Updated Aug 4, 2024 • 1

Lyuhong/ppo-CartPole-v1

Reinforcement Learning • Updated Aug 5, 2024

Lyuhong/ppo-8-v1

Reinforcement Learning • Updated Aug 5, 2024

Charles0831/ppo-LunarLander-v2-u8

Reinforcement Learning • Updated Aug 5, 2024

Charles0831/ppo-LunarLander-v2-u8-2

Reinforcement Learning • Updated Aug 5, 2024