Edit Models filters

Models

3,301

Base only

Active filters: ppo

bnurpek/try2-gpt2-256T-neg-1

Reinforcement Learning • 0.1B • Updated Jan 2, 2024

bnurpek/try2-gpt2-256T-neg-2

Reinforcement Learning • 0.1B • Updated Jan 2, 2024 • 1

bnurpek/try2-gpt2-256T-neg-3

Reinforcement Learning • 0.1B • Updated Jan 2, 2024

bnurpek/try2-gpt2-256T-neg-5

Reinforcement Learning • 0.1B • Updated Jan 2, 2024

bnurpek/try2-gpt2-256T-neg-7

Reinforcement Learning • 0.1B • Updated Jan 2, 2024 • 1

bnurpek/try2-gpt2-256T-neg-10

Reinforcement Learning • 0.1B • Updated Jan 2, 2024 • 1

bnurpek/try2-gpt2-256T-neg-15

Reinforcement Learning • 0.1B • Updated Jan 2, 2024

bnurpek/try2-gpt2-256T-neg-20

Reinforcement Learning • 0.1B • Updated Jan 2, 2024 • 1

bnurpek/try2-gpt2-256T-neg-30

Reinforcement Learning • 0.1B • Updated Jan 2, 2024 • 2

bnurpek/try2-gpt2-256T-neg-50

Reinforcement Learning • 0.1B • Updated Jan 2, 2024

bnurpek/try2-gpt2-256T-neg-70

Reinforcement Learning • 0.1B • Updated Jan 2, 2024

SkyR/ppo-hc-CartPole-v1

Reinforcement Learning • Updated Jan 2, 2024

bnurpek/kl0.7-gpt2-256T-neg-0

Reinforcement Learning • 0.1B • Updated Jan 2, 2024 • 1

bnurpek/kl0.7-gpt2-256T-neg-1

Reinforcement Learning • 0.1B • Updated Jan 2, 2024 • 1

bnurpek/kl0.7-gpt2-256T-neg-2

Reinforcement Learning • 0.1B • Updated Jan 2, 2024 • 2

bnurpek/kl0.7-gpt2-256T-neg-3

Reinforcement Learning • 0.1B • Updated Jan 2, 2024 • 4

bnurpek/kl0.7-gpt2-256T-neg-5

Reinforcement Learning • 0.1B • Updated Jan 2, 2024

bnurpek/kl0.7-gpt2-256T-neg-7

Reinforcement Learning • 0.1B • Updated Jan 2, 2024 • 1

bnurpek/kl0.7-gpt2-256T-neg-10

Reinforcement Learning • 0.1B • Updated Jan 2, 2024 • 3

bnurpek/kl0.7-gpt2-256T-neg-15

Reinforcement Learning • 0.1B • Updated Jan 2, 2024 • 4

bnurpek/kl0.7-gpt2-256T-neg-20

Reinforcement Learning • 0.1B • Updated Jan 2, 2024

taku-yoshioka/test

Reinforcement Learning • Updated Jan 2, 2024

bnurpek/kl0.9-gpt2-256T-neg-0

Reinforcement Learning • 0.1B • Updated Jan 2, 2024

bnurpek/kl0.9-gpt2-256T-neg-1

Reinforcement Learning • 0.1B • Updated Jan 2, 2024 • 2

bnurpek/kl0.9-gpt2-256T-neg-2

Reinforcement Learning • 0.1B • Updated Jan 2, 2024

bnurpek/kl0.9-gpt2-256T-neg-3

Reinforcement Learning • 0.1B • Updated Jan 2, 2024

bnurpek/kl0.9-gpt2-256T-neg-5

Reinforcement Learning • 0.1B • Updated Jan 2, 2024 • 1

bnurpek/kl0.9-gpt2-256T-neg-7

Reinforcement Learning • 0.1B • Updated Jan 2, 2024

bnurpek/kl0.9-gpt2-256T-neg-10

Reinforcement Learning • 0.1B • Updated Jan 2, 2024

bnurpek/kl0.9-gpt2-256T-neg-15

Reinforcement Learning • 0.1B • Updated Jan 2, 2024 • 1