Edit Models filters

Models

3,301

Base only

Active filters: ppo

rahil1206/ppo-tutorial-LunarLander-v2

Reinforcement Learning • Updated May 1, 2024

Joalbom14/ppo-LunarLander-v2-CleanRL

Reinforcement Learning • Updated May 2, 2024

pkbiswas/Phi-3-Detoxified-PPO-LoRa

Reinforcement Learning • Updated May 18, 2024 • 6

stvnl/ppo_model_en

Reinforcement Learning • Updated May 2, 2024 • 3

hanyinwang/layer-project-diagnostic-mistral

Reinforcement Learning • Updated May 3, 2024 • 2

archbold/ppo-CartPole-v1

Reinforcement Learning • Updated May 4, 2024

archbold/ppo-LunarLander-v2_unit8

Reinforcement Learning • Updated May 4, 2024

Megalino111/LunarLander-v2

Reinforcement Learning • Updated May 5, 2024

BWangila/ppo-CartPole-v1

Reinforcement Learning • Updated May 5, 2024

BWangila/ppo-LunarLander-v2

Reinforcement Learning • Updated May 6, 2024

pietroorlandi/ppo-CartPole-from-scratch

Reinforcement Learning • Updated May 6, 2024

elisamammi/ppo-CartPole-v1

Reinforcement Learning • Updated May 6, 2024

pietroorlandi/ppo-LunarLander-from-scratch

Reinforcement Learning • Updated May 6, 2024

elisamammi/ppo-LunarLander_v2

Reinforcement Learning • Updated May 6, 2024

APLunch/ppo-LunarLanderV2-cleanRL

Reinforcement Learning • Updated May 7, 2024

baek26/all_6618_all_6417_bart-base_rl

Reinforcement Learning • 0.1B • Updated May 7, 2024 • 4

baek26/all_8243_all_6417_bart-base_rl

Reinforcement Learning • 0.1B • Updated May 7, 2024 • 1

baek26/all_6959_all_6417_bart-base_rl

Reinforcement Learning • 0.1B • Updated May 7, 2024 • 2

baek26/all_2022_all_6417_bart-base_rl

Reinforcement Learning • 0.1B • Updated May 7, 2024 • 1

baek26/Ours-crossrl2

Reinforcement Learning • 0.1B • Updated May 7, 2024 • 2

baek26/all_1445_all_6417_bart-base_rl

Reinforcement Learning • 0.1B • Updated May 7, 2024 • 1

dhajnes/Lunar-own-ppo

Reinforcement Learning • Updated May 7, 2024

baek26/all_3769_all_6417_bart-base_rl

Reinforcement Learning • 0.1B • Updated May 8, 2024 • 2

AhmedTarek/ppo-LunarLaner-v2-try2

Reinforcement Learning • Updated May 8, 2024

haytamelouarrat/ppo-CartPole-v1

Reinforcement Learning • Updated May 9, 2024

Lingrui1/unit8

Reinforcement Learning • Updated May 10, 2024

pkbiswas/Phi-3-Detoxified-PPO-QLoRa

Reinforcement Learning • Updated May 10, 2024 • 1

mrbesher/custom-ppo-LunarLander-v2

Reinforcement Learning • Updated May 11, 2024

lctzz540/bunboppo

Reinforcement Learning • Updated May 14, 2024

baek26/bart-cnndm-oracle

Reinforcement Learning • 0.1B • Updated May 13, 2024