RegularizedSelfPlay
/

Llama-3-8B-Instruct-SPPO-Iter3

Model card Files Files and versions

Llama-3-8B-Instruct-SPPO-Iter3

Commit History

Upload tokenizer

3582d9b
verified

Sangwoong commited on Mar 29, 2025

Upload LlamaForCausalLM

c0069a0
verified

Sangwoong commited on Mar 29, 2025

initial commit

a0fbd46
verified

Sangwoong commited on Mar 29, 2025