RegularizedSelfPlay
/

sppo_forwardimportance10-0.1-PromptABC-LLAMA-3-8B-Instruct-SPPO-Iter1

Text Generation

text-generation-inference

Model card Files Files and versions

sppo_forwardimportance10-0.1-PromptABC-LLAMA-3-8B-Instruct-SPPO-Iter1

Commit History

Upload LlamaForCausalLM

7ad2165
verified

angelahzyuan commited on Jan 25, 2025

Upload tokenizer

c7d173a
verified

angelahzyuan commited on Jan 25, 2025

Upload LlamaForCausalLM

693fc92
verified

angelahzyuan commited on Jan 25, 2025

initial commit

db4727d
verified

angelahzyuan commited on Jan 25, 2025