Edit Models filters

Apps

Docker Model Runner

Inference Providers

OVHcloud AI Endpoints

HF Inference API

Misc

Inference Endpoints

text-generation-inference

Eval Results (legacy)

text-embeddings-inference

4-bit precision

8-bit precision

Mixture of Experts

Carbon Emissions

Models

3,063

Full-text search

Active filters: ppo

jvelja/vllm-gemma2b-stringMatcher-newDataset_4

Reinforcement Learning • Updated Sep 11, 2024

YisusLn/ppo-unit8-LunarLancer-v2

Reinforcement Learning • Updated Sep 13, 2024

Vivek-huggingface/ppo_from_scratch

Reinforcement Learning • Updated Sep 15, 2024

mihofer/ppo_reimplement_lunarlanderv2

Reinforcement Learning • Updated Sep 16, 2024

caiiofc/ppo-fs-LunarLander-v2

Reinforcement Learning • Updated Sep 16, 2024

hug-me-please/RL_CAMEL

Reinforcement Learning • Updated Sep 19, 2024 • 2

svetaU/ppo-LunarLander-v2

Reinforcement Learning • Updated Sep 21, 2024

mkdem/ll22

Reinforcement Learning • Updated Sep 19, 2024

evgeniypark/ppo-LunarLander-v2-handmade

Reinforcement Learning • Updated Sep 19, 2024

maartenx01/ppo-CleanRL-LunarLander-v2

Reinforcement Learning • Updated Sep 19, 2024

kalmi901/ppo-CleanRL-LunarLander-v2

Reinforcement Learning • Updated Sep 22, 2024

wistanmar/ppo-LunarLander-v2

Reinforcement Learning • Updated Feb 24, 2025

SpyrosMitsis/ppo-LunarLander-v2-CleanRL

Reinforcement Learning • Updated Sep 26, 2024

Dorian-T/LunarLander-v2-ppo-fromScratch

Reinforcement Learning • Updated Sep 26, 2024

Khashayarrah/LunarLander-v2

Reinforcement Learning • Updated Sep 26, 2024

petertrung8/ppo-LunarLander-v1

Reinforcement Learning • Updated Sep 27, 2024

gokuuu/CartPole-v1-ppo

Reinforcement Learning • Updated Sep 27, 2024

esperesa/unit8-ppo-LunarLander-v2

Reinforcement Learning • Updated Sep 29, 2024

apple9855/ppo-cleanrl-lunarlander-v2

Reinforcement Learning • Updated Sep 29, 2024

nafizshahriar/LunarLanderV2

Reinforcement Learning • Updated Sep 29, 2024

sswt/ppo-LunarLander-v2-crl

Reinforcement Learning • Updated Sep 30, 2024

alient12/ppo-CartPole-v1

Reinforcement Learning • Updated Sep 30, 2024

eloise54/cleanRL-ppo-LunarLander-v2

Reinforcement Learning • Updated Oct 1, 2024

ValentinGuigon/ppo-CartPole-v1

Reinforcement Learning • Updated Oct 1, 2024

ValentinGuigon/ppo-LunarLander-v2

Reinforcement Learning • Updated Oct 1, 2024

gziz/ppo-scratch-LunarLander

Reinforcement Learning • Updated Oct 2, 2024

seangogo/ppo-CartPole-v1-ppo-from-scratch

Reinforcement Learning • Updated Oct 2, 2024

grib0ed0v/ppo-LunarLander-v2-unit8

Reinforcement Learning • Updated Oct 4, 2024

Klimxo/ppo-CartPole-v1

Reinforcement Learning • Updated Oct 6, 2024

Klimxo/own-ppo-LunarLander-v2

Reinforcement Learning • Updated Oct 6, 2024