lordChipotle
/

Llama3GRPOReasoning

Reinforcement Learning

Model card Files Files and versions

Llama3GRPOReasoning / generation_config.json

Commit History

Upload LlamaForCausalLM

b3ebf5c
verified

lordChipotle commited on Jun 4, 2025