Edit Models filters

Models

3,294

Base only

Active filters: ppo

ajagota71/pythia-410m-fb-detox-checkpoint-epoch-20

Reinforcement Learning • 0.4B • Updated May 16, 2025 • 1

ajagota71/pythia-410m-fb-detox-checkpoint-epoch-40

Reinforcement Learning • 0.4B • Updated May 16, 2025 • 1

ajagota71/pythia-410m-fb-detox-checkpoint-epoch-60

Reinforcement Learning • 0.4B • Updated May 16, 2025 • 1

ajagota71/pythia-410m-fb-detox-checkpoint-epoch-80

Reinforcement Learning • 0.4B • Updated May 16, 2025

ajagota71/pythia-410m-fb-detox-checkpoint-epoch-100

Reinforcement Learning • 0.4B • Updated May 16, 2025 • 1

ajagota71/pythia-410m-fb-detox-checkpoint-epoch-120

Reinforcement Learning • 0.4B • Updated May 16, 2025

ajagota71/pythia-410m-fb-detox-checkpoint-epoch-140

Reinforcement Learning • 0.4B • Updated May 16, 2025

ajagota71/pythia-410m-fb-detox-checkpoint-epoch-160

Reinforcement Learning • 0.4B • Updated May 16, 2025 • 2

ajagota71/pythia-410m-fb-detox-checkpoint-epoch-180

Reinforcement Learning • 0.4B • Updated May 16, 2025 • 1

ajagota71/pythia-410m-fb-detox-checkpoint-epoch-200

Reinforcement Learning • 0.4B • Updated May 16, 2025

ajagota71/pythia-410m-fb-detox

Reinforcement Learning • 0.4B • Updated May 16, 2025 • 1

jonv1/lunar-lander-v1

Reinforcement Learning • Updated May 17, 2025

jtan4albany/ppo-lunarlander

Reinforcement Learning • Updated May 19, 2025

jtan4albany/lunarlander-unit8

Reinforcement Learning • Updated May 19, 2025

GinesMeca/ppo-LunarLander-v2.1

Reinforcement Learning • Updated May 21, 2025

ajmalmahmood/ppo-CartPole-v1

Reinforcement Learning • Updated May 22, 2025

ajmalmahmood/LunarLander-v2

Reinforcement Learning • Updated May 22, 2025

winssu/LunarLander-v2-ppo

Reinforcement Learning • Updated May 22, 2025

refikcam/ppo-LunarLander-fromScratch

Reinforcement Learning • Updated May 22, 2025

vinoth16/LunarLander-v2

Reinforcement Learning • Updated May 24, 2025

gabrielbo/spark-model-QLoRA

Text Generation • Updated May 24, 2025 • 1

aarifahullah/LunarLander-v2_CleanRL

Reinforcement Learning • Updated May 24, 2025

kjamesh/ppo-CartPole-v1

Reinforcement Learning • Updated May 24, 2025

kjamesh/ppo-custom-LunarLander-v2

Reinforcement Learning • Updated May 24, 2025

wowthecoder/customPPO-LunarLander-v2

Reinforcement Learning • Updated May 25, 2025

cheetahbooked/lunar-lander-custom-ppo

Reinforcement Learning • Updated May 25, 2025

jegeblad/ppo-Lunar

Reinforcement Learning • Updated May 26, 2025

lmcastanedame/ppo-LunarLander-v2

Reinforcement Learning • Updated Jun 4, 2025 • 5

samcomber/lunar-lander-torch-ppo

Reinforcement Learning • Updated May 28, 2025

samcomber/ppo-cartpole

Reinforcement Learning • Updated May 28, 2025