RegularizedSelfPlay
/

sppo_forwardimportance10-0.01-PromptABC-LLAMA-3-8B-Instruct-SPPO-Iter3

Text Generation

text-generation-inference

Model card Files Files and versions

sppo_forwardimportance10-0.01-PromptABC-LLAMA-3-8B-Instruct-SPPO-Iter3

Commit History

Upload tokenizer

2e8f00a
verified

angelahzyuan commited on Jan 30, 2025

Upload LlamaForCausalLM

20ef585
verified

angelahzyuan commited on Jan 30, 2025

initial commit

47b39dc
verified

angelahzyuan commited on Jan 30, 2025