RegularizedSelfPlay
/

Llama-3-8B-Instruct-SPPO-Iter2-gp-8b-gpm-table

Text Generation

text-generation-inference

Model card Files Files and versions

Llama-3-8B-Instruct-SPPO-Iter2-gp-8b-gpm-table

Commit History

Upload tokenizer

636cc8b
verified

timxiaohangt commited on Jul 30, 2025

Upload LlamaForCausalLM

652805e
verified

timxiaohangt commited on Jul 30, 2025

initial commit

4c94a76
verified

timxiaohangt commited on Jul 30, 2025