Edit Models filters

Models

3,301

Base only

Active filters: ppo

davidgaofc/revision_PPO0.4

Reinforcement Learning • 60.5M • Updated Aug 17, 2024 • 2

jvelja/ppo-gemma-2-2b-it_fullyUnseeded

Reinforcement Learning • Updated Aug 17, 2024

jvelja/ppo-gemma-2-2b-it_fullyUnseeded_v2

Reinforcement Learning • Updated Aug 17, 2024 • 1

martomor/ppo-LunarLander-v2

Reinforcement Learning • Updated Nov 1, 2024

gubhaalimpu/ppo-CartPole-v1

Reinforcement Learning • Updated Aug 18, 2024

jvelja/ppo-gemma-2-2b-it_fullyUnseeded_MULTIBIT

Reinforcement Learning • Updated Aug 19, 2024

oookayamaswallow/ppo-CartPole-v1

Reinforcement Learning • Updated Aug 20, 2024

jvelja/ppo-self.llama-3-8b-Instruct_fullyUnseeded_MULTIBIT_0

Reinforcement Learning • Updated Aug 21, 2024

Adripro01/ppo-Lunarlander-v2_2

Reinforcement Learning • Updated Aug 21, 2024

jvelja/ppo-gemma-2-2b-it-unseeded_0

Reinforcement Learning • Updated Aug 21, 2024

jvelja/gemma-2-2b-it_imdb_seeded_0

Reinforcement Learning • Updated Aug 21, 2024 • 1

jvelja/gemma-2-2b-it_imdb_0

Reinforcement Learning • Updated Aug 21, 2024 • 1

jvelja/gemma-2-2b-it_imdb_2bit_0

Reinforcement Learning • Updated Aug 22, 2024

jvelja/gemma-2-2b-it_imdb_1

Reinforcement Learning • Updated Aug 21, 2024

jvelja/gemma-2-2b-it_imdb_2bit_1

Reinforcement Learning • Updated Aug 22, 2024 • 1

jvelja/gemma-2-2b-it_imdb_2

Reinforcement Learning • Updated Aug 21, 2024

jvelja/gemma-2-2b-it_imdb_2bit_2

Reinforcement Learning • Updated Aug 22, 2024

jvelja/ppo-gemma-2-2b-it-unseeded_1

Reinforcement Learning • Updated Aug 21, 2024 • 1

jvelja/ppo-gemma-2-2b-it-unseeded_2

Reinforcement Learning • Updated Aug 21, 2024

anacg/ppo-LunarLander-v2

Reinforcement Learning • Updated Sep 2, 2024

jvelja/gemma-2-2b-it_imdb_2bit_3

Reinforcement Learning • Updated Aug 22, 2024

jvelja/gemma-2-2b-it_imdb_2bit_4

Reinforcement Learning • Updated Aug 22, 2024

jvelja/gpt2_imdb_0

Reinforcement Learning • 0.1B • Updated Aug 22, 2024

jvelja/gpt2_imdb_1

Reinforcement Learning • 0.1B • Updated Aug 22, 2024

jvelja/gpt2_imdb_2

Reinforcement Learning • 0.1B • Updated Aug 22, 2024

jvelja/gpt2_imdb_3

Reinforcement Learning • 0.1B • Updated Aug 22, 2024 • 1

jvelja/gpt2_imdb_4

Reinforcement Learning • 0.1B • Updated Aug 22, 2024 • 1

jvelja/gpt2_imdb_5

Reinforcement Learning • 0.1B • Updated Aug 22, 2024

jvelja/gpt2_imdb_6

Reinforcement Learning • 0.1B • Updated Aug 22, 2024 • 1

jvelja/gpt2_imdb_7

Reinforcement Learning • 0.1B • Updated Aug 22, 2024 • 2