Edit Models filters

Model Tree

Apps

Docker Model Runner

Inference Providers

OVHcloud AI Endpoints

HF Inference API

Misc

Inference Endpoints

text-generation-inference

Eval Results (legacy)

text-embeddings-inference

4-bit precision

8-bit precision

Mixture of Experts

Carbon Emissions

Models

3,206

Base only

Active filters: ppo

kar-saaragh/ppo-cml-LunarLander-v2

Reinforcement Learning • Updated Jan 20, 2024

kar-saaragh/ppo-cml-LunarLander-v3

Reinforcement Learning • Updated Jan 20, 2024

kar-saaragh/ppo-cml-LunarLander-v4

Reinforcement Learning • Updated Jan 20, 2024

beibeif/ppo-lunar-v1

Reinforcement Learning • Updated Jan 20, 2024

satcos/LunarLander-v2.1

Reinforcement Learning • Updated Jan 22, 2024

TitanTec/ppo-LunaInvader-T2

Reinforcement Learning • Updated Jan 24, 2024

Ivan0831/DRL

Reinforcement Learning • Updated Jan 24, 2024

Ivan0831/PPO-LunarLander-Default

Reinforcement Learning • Updated Jan 24, 2024

Ivan0831/PPO-LunarLander-V1

Reinforcement Learning • Updated Jan 24, 2024

Ivan0831/PPO-LunarLander-V2

Reinforcement Learning • Updated Jan 24, 2024

Ivan0831/PPO-LunarLander-V3

Reinforcement Learning • Updated Jan 24, 2024

jun1t/rl_learn_ppo

Reinforcement Learning • Updated Jan 24, 2024

Ivan0831/PPO-LunarLander-V4

Reinforcement Learning • Updated Jan 24, 2024

Ivan0831/PPO-LunarLander-V5

Reinforcement Learning • Updated Jan 24, 2024

tpedelose/ppo-LunarLander-v2-custom

Reinforcement Learning • Updated Jan 24, 2024

hpourmodheji/ppo-CartPole-v1

Reinforcement Learning • Updated Jul 11, 2024

xiawei910/U8LunarLander-v2

Reinforcement Learning • Updated Jan 26, 2024

danlindb/PPO-LunarLander-v2-unit8

Reinforcement Learning • Updated Jan 26, 2024

farzintava/LunarLander-v2

Reinforcement Learning • Updated Jan 27, 2024

vierlinglukas/ppo_stickthing

Reinforcement Learning • Updated Jan 27, 2024

taku-yoshioka/rlhf-line-marcja

Reinforcement Learning • Updated Jan 28, 2024 • 1

Marcus2112/ppo-LunarLander-v2

Reinforcement Learning • Updated Jan 29, 2024

wahaha1987/LunarLander-v2

Reinforcement Learning • Updated Jan 29, 2024

wahaha1987/LunarLander-v2-gymnasium

Reinforcement Learning • Updated Jan 29, 2024

shahzebnaveed/ppo-lunarlander

Reinforcement Learning • Updated Jan 31, 2024

HazemHM/PPO-LunarLander

Reinforcement Learning • Updated Jan 31, 2024

nullne/LunarLander-v2

Reinforcement Learning • Updated Feb 1, 2024

saraswathi01/dummy

Reinforcement Learning • Updated Feb 12, 2024

Mattttthew/PPO-LunarLander-Self_Implemented

Reinforcement Learning • Updated Feb 2, 2024

Dhanraj1503/LunarLander-ppo

Reinforcement Learning • Updated Feb 3, 2024