Edit Models filters

Models

3,301

Base only

Active filters: ppo

jvelja/gpt2_imdb_8

Reinforcement Learning • 0.1B • Updated Aug 22, 2024 • 1

jvelja/gpt2_imdb_9

Reinforcement Learning • 0.1B • Updated Aug 22, 2024 • 1

jvelja/gpt2_imdb_10

Reinforcement Learning • 0.1B • Updated Aug 22, 2024 • 1

jvelja/gpt2_imdb_11

Reinforcement Learning • 0.1B • Updated Aug 22, 2024 • 1

jvelja/gpt2_imdb_12

Reinforcement Learning • 0.1B • Updated Aug 22, 2024

jvelja/gpt2_imdb_13

Reinforcement Learning • 0.1B • Updated Aug 22, 2024

jvelja/gemma-2-2b-it_imdb_probits_0

Reinforcement Learning • Updated Aug 22, 2024 • 1

jvelja/gemma-2-2b-it-seed-1_0

Reinforcement Learning • Updated Aug 23, 2024 • 1

jvelja/gemma-2-2b-it-paraphrase_0

Reinforcement Learning • Updated Aug 23, 2024 • 1

jvelja/gemma-2-2b-it-seed-1_2bit_seed1_0

Reinforcement Learning • Updated Aug 23, 2024 • 1

jvelja/gemma-2-2b-it-paraphrase_1

Reinforcement Learning • Updated Aug 23, 2024

jvelja/gemma-2-2b-it-seed-1_2bit_seed1_1

Reinforcement Learning • Updated Aug 23, 2024

jvelja/gemma-2-2b-it-seed-1_2bit_seed1_2

Reinforcement Learning • Updated Aug 23, 2024

jvelja/gemma-2-2b-it-paraphrase_2

Reinforcement Learning • Updated Aug 23, 2024 • 1

jvelja/gemma-2-2b-it-seed-1_2bit_seed1_3

Reinforcement Learning • Updated Aug 23, 2024

paudelapil/LunarLander_CleanRL-v2

Reinforcement Learning • Updated Aug 25, 2024

jvelja/gemma-2-2b-it-paraphrase_3

Reinforcement Learning • Updated Aug 23, 2024

jvelja/gemma-2-2b-it-seed-1_2bit_seed1_4

Reinforcement Learning • Updated Aug 23, 2024

mertgulexe/mistral-ppo

Reinforcement Learning • 84.5M • Updated Aug 28, 2024

hugging-robot/ppo-LunarLander-v2-unit8

Reinforcement Learning • Updated Aug 24, 2024

cpgrant/Reinforce-LunarLander-v2-240824-0859

Reinforcement Learning • Updated Aug 24, 2024

jvelja/gemma-2-2b-it-logOdds_0

Reinforcement Learning • Updated Aug 24, 2024 • 2

jvelja/gemma-2-2b-it-logOdds_2bit_logOdds_0

Reinforcement Learning • Updated Aug 24, 2024 • 1

jvelja/gemma-2-2b-it-logOdds_1

Reinforcement Learning • Updated Aug 24, 2024 • 3

jvelja/gemma-2-2b-it-logOdds_2bit_logOdds_1

Reinforcement Learning • Updated Aug 24, 2024 • 1

jvelja/gemma-2-2b-it-logOdds_2

Reinforcement Learning • Updated Aug 24, 2024 • 1

jvelja/gemma-2-2b-it-logOdds_3

Reinforcement Learning • Updated Aug 24, 2024 • 1

jvelja/gemma-2-2b-it-logOdds_2bit_logOdds_2

Reinforcement Learning • Updated Aug 24, 2024 • 1

jvelja/gemma-2-2b-it-logOdds_4

Reinforcement Learning • Updated Aug 24, 2024 • 1

jvelja/gemma-2-2b-it-logOdds_2bit_logOdds_3

Reinforcement Learning • Updated Aug 24, 2024