Edit Models filters

Model Tree

Apps

Docker Model Runner

Inference Providers

OVHcloud AI Endpoints

HF Inference API

Misc

Inference Endpoints

text-generation-inference

Eval Results (legacy)

text-embeddings-inference

4-bit precision

8-bit precision

Mixture of Experts

Carbon Emissions

Models

3,203

Base only

Active filters: ppo

jvelja/ppo-distilbert-base-uncased-epoch-40

Reinforcement Learning • Updated Jul 26, 2024 • 2

yhyeo0202/ppo-LunarLander-v2

Reinforcement Learning • Updated Sep 19, 2024 • 5

jvelja/ppo-gpt2-epoch-0

Reinforcement Learning • 0.1B • Updated Jul 26, 2024 • 2

jvelja/ppo-gpt2-epoch-10

Reinforcement Learning • 0.1B • Updated Jul 26, 2024

jvelja/ppo-gpt2-epoch-20

Reinforcement Learning • 0.1B • Updated Jul 26, 2024 • 1

jvelja/ppo-gpt2-epoch-30

Reinforcement Learning • 0.1B • Updated Jul 26, 2024 • 1

jvelja/ppo-gpt2-epoch-40

Reinforcement Learning • 0.1B • Updated Jul 26, 2024 • 1

jvelja/ppo-gpt2-epoch-50

Reinforcement Learning • 0.1B • Updated Jul 26, 2024 • 1

jvelja/ppo-Meta-Llama-3.1-8B-epoch-0

Reinforcement Learning • Updated Jul 26, 2024 • 3

jvelja/ppo-Meta-Llama-3.1-8B-epoch-10

Reinforcement Learning • Updated Jul 26, 2024 • 1

jvelja/ppo-gemma-2b-epoch-0

Reinforcement Learning • Updated Jul 26, 2024 • 4

jvelja/ppo-gemma-2b-epoch-10

Reinforcement Learning • Updated Jul 26, 2024 • 1

jvelja/ppo-gemma-2b-epoch-20

Reinforcement Learning • Updated Jul 26, 2024 • 1

jvelja/ppo-gemma-2b-epoch-30

Reinforcement Learning • Updated Jul 26, 2024 • 1

jvelja/ppo-gemma-2b-epoch-40

Reinforcement Learning • Updated Jul 26, 2024 • 1

jvelja/ppo-gemma-2b-epoch-50

Reinforcement Learning • Updated Jul 26, 2024 • 3

jvelja/ppo-gemma-2b-epoch-60

Reinforcement Learning • Updated Jul 26, 2024 • 1

jvelja/ppo-gemma-2b-epoch-70

Reinforcement Learning • Updated Jul 26, 2024 • 1

jvelja/ppo-gemma-2b-epoch-80

Reinforcement Learning • Updated Jul 26, 2024 • 1

jvelja/ppo-gemma-2b-epoch-90

Reinforcement Learning • Updated Jul 26, 2024 • 1

SwarajRay/ppo-CartPole-v1-unit8

Reinforcement Learning • Updated Jul 27, 2024

hishamcse/mortal-kombat-3-ppo-diambra

Reinforcement Learning • Updated Aug 12, 2024 • 5 • 1

NeoCodes-dev/Unit8_part1_V1

Reinforcement Learning • Updated Jul 28, 2024

tcottone/LunarLander-v2-2

Reinforcement Learning • Updated Jul 30, 2024

ThNaToS/LunarLanderv2

Reinforcement Learning • Updated Jul 31, 2024

andriJulian/ppo-v2-sm

Reinforcement Learning • Updated Aug 1, 2024

bakermann/ppo-Lunar_v2

Reinforcement Learning • Updated Aug 2, 2024

execbat/ppo-LunarLander-v2-unit-8

Reinforcement Learning • Updated Aug 2, 2024

dogukankartal/ppo_pytorch_lunar_lander_v2

Reinforcement Learning • Updated Aug 3, 2024 • 1

davidkh/ppo-CartPole-v1

Reinforcement Learning • Updated Aug 4, 2024