alibidaran
/

GRPO_LLAMA3-instructive_reasoning1

text-generation-inference

Model card Files Files and versions

GRPO_LLAMA3-instructive_reasoning1 / tokenizer_config.json

Commit History

Upload model trained with Unsloth

f9f7cda
verified

alibidaran commited on Jul 26, 2025