Edit Models filters

Model Tree

Apps

Docker Model Runner

Inference Providers

OVHcloud AI Endpoints

HF Inference API

Misc

Inference Endpoints

text-generation-inference

Eval Results (legacy)

text-embeddings-inference

4-bit precision

8-bit precision

Mixture of Experts

Carbon Emissions

Models

3,205

Base only

Active filters: ppo

baek26/all_3420_bart-all_rl

Reinforcement Learning • 0.1B • Updated May 27, 2024 • 1

DavidPL1/ppo2-LunarLander-v2

Reinforcement Learning • Updated May 27, 2024

baek26/all_5200_bart-all_rl

Reinforcement Learning • 0.1B • Updated May 27, 2024 • 1

baek26/all_2428_bart-cnndm_rl

Reinforcement Learning • 0.1B • Updated May 28, 2024 • 1

baek26/bart-dialog2all1

Reinforcement Learning • 0.1B • Updated May 28, 2024 • 2

baek26/bart-dialog2all10

Reinforcement Learning • 0.1B • Updated May 28, 2024 • 1

baek26/bart-dialog2all100

Reinforcement Learning • 0.1B • Updated May 28, 2024 • 2

RomBor/ppo8-lunarlander-v2

Reinforcement Learning • Updated May 29, 2024

baek26/all_2925_bart-billsum_rl

Reinforcement Learning • 0.1B • Updated May 29, 2024 • 2

baek26/all_7770_bart-cnndm_rl

Reinforcement Learning • 0.1B • Updated May 29, 2024 • 1

baek26/all_7065_bart-cnndm_rl

Reinforcement Learning • 0.1B • Updated May 29, 2024 • 1

baek26/all_2354_bart-billsum_rl

Reinforcement Learning • 0.1B • Updated May 29, 2024 • 2

k1101jh/ppo-CartPole-v1

Reinforcement Learning • Updated May 29, 2024

k1101jh/ppo-LunarLander-v2-unit8

Reinforcement Learning • Updated May 29, 2024

baek26/all_2485_bart-billsum_rl

Reinforcement Learning • 0.1B • Updated May 29, 2024 • 1

FernandoD95/Reinforce_1

Reinforcement Learning • Updated May 31, 2024

FernandoD95/Reinforce_2

Reinforcement Learning • Updated May 31, 2024

liqiu0202/ppo-LunarLander-v2

Reinforcement Learning • Updated May 31, 2024

juanzinser/ppo-CartPole-v1

Reinforcement Learning • Updated Jun 2, 2024

juanzinser/ppo-lunar-lander

Reinforcement Learning • Updated Jun 2, 2024

ws11yrin/ppo-CleanRL-LunarLander-v2

Reinforcement Learning • Updated Jun 2, 2024

moczard/ppo-LunarLander-v2-2

Reinforcement Learning • Updated Jun 2, 2024

PrithviS/LunarLander-v2-scratch

Reinforcement Learning • Updated Jun 4, 2024

PrithviS/LunarLander-v2-scratch-2

Reinforcement Learning • Updated Jun 4, 2024

girayo/lunar-lander-ppo

Reinforcement Learning • Updated Jun 4, 2024

PrithviS/LunarLander-v2-scratch-3

Reinforcement Learning • Updated Jun 4, 2024

Edgar404/ppo-CartPole-v1

Reinforcement Learning • Updated Jun 6, 2024

Vanster/ppo-LunarLander-v2

Reinforcement Learning • Updated Jun 23, 2024 • 3

LMrilo/ppo-LunarLander-v2-unit8

Reinforcement Learning • Updated Jun 7, 2024

arhamk/ppo-LunarLander-v2-2

Reinforcement Learning • Updated Jun 10, 2024