Edit Models filters

Model Tree

Apps

Docker Model Runner

Inference Providers

OVHcloud AI Endpoints

HF Inference API

Misc

Inference Endpoints

text-generation-inference

Eval Results (legacy)

text-embeddings-inference

4-bit precision

8-bit precision

Mixture of Experts

Carbon Emissions

Models

3,205

Base only

Active filters: ppo

Rudolph314/ppo-LunarLander-v2

Reinforcement Learning • Updated Jun 11, 2024

colinrgodsey/ppo-LunarLander-v2

Reinforcement Learning • Updated Jul 17, 2024 • 7

santiviquez/flan-t5-small-ppo

Reinforcement Learning • 77M • Updated Jun 13, 2024 • 3

candrews1971/ppo-CartPole-v1

Reinforcement Learning • Updated Jun 13, 2024

candrews1971/ppo-LunarLander-v2.1

Reinforcement Learning • Updated Jun 14, 2024

Ricardo54321/LunarLander-PPOCleanRL

Reinforcement Learning • Updated Jun 14, 2024

Abhinay45/LunarLander-v2-8

Reinforcement Learning • Updated Jun 14, 2024

QingchuanMa/LunarLander-v2-ppo

Reinforcement Learning • Updated Jun 16, 2024

polyconnect/ppo-LunarLander-v2_unit8

Reinforcement Learning • Updated Jun 16, 2024

chandrasekhar319/gemma-ppo-10k

Reinforcement Learning • Updated Jun 19, 2024 • 4

dana11235/ppo-LunarLander-scratch

Reinforcement Learning • Updated Jun 19, 2024

vxst2/ppo2-LunarLander-v2

Reinforcement Learning • Updated Jun 19, 2024

M2LabOrg/LunarLander-v2

Reinforcement Learning • Updated Jun 20, 2024

satyamandavilli/lunar-scratch

Reinforcement Learning • Updated Jun 20, 2024

Firemedic15/ppo-LunarLander-v2

Reinforcement Learning • Updated Jun 21, 2024

diepala/ppo-LunarLander-v2-unit8

Reinforcement Learning • Updated Jun 22, 2024

gg232/ppo-LunarLander-v2-new

Reinforcement Learning • Updated Jun 23, 2024

HadrienCr/LunarLander

Reinforcement Learning • Updated Jun 24, 2024

hishamcse/ppo-LunarLander-v2-scratch

Reinforcement Learning • Updated Aug 12, 2024

daniilxcode/ppoScratch-LunarLander-v2

Reinforcement Learning • Updated Jun 24, 2024

HadrienCr/cleanRL-ppo-LunarLander

Reinforcement Learning • Updated Jun 25, 2024

espnet/xeus

Automatic Speech Recognition • Updated Jun 17, 2025 • 191 • 148

MoxoffSrL/Moxoff-Phi3Mini-PPO

Text Generation • 4B • Updated Jun 27, 2024 • 2.55k •

colinrgodsey/ppo-CartPole-v1

Reinforcement Learning • Updated Jun 25, 2024

Pandita-IA/ppo-LunarLanderScratch-v2

Reinforcement Learning • Updated Jun 26, 2024

mttgermano/LunarLander-v2

Reinforcement Learning • Updated Jun 28, 2024

KhanLee0930/ppo-1

Reinforcement Learning • Updated Jun 29, 2024

gruhit-patel/PPO-LunarLandar-v2

Reinforcement Learning • Updated Jul 1, 2024

aadarshram/ppo-LunarLander-v2-from_scratch

Reinforcement Learning • Updated Jul 4, 2024

Hamze-Hammami/Land-Lunar-from-Sratch

Reinforcement Learning • Updated Jul 4, 2024