alibidaran
/

GRPO_LLAMA3_Reasoning_Consultor

text-generation-inference

Model card Files Files and versions

GRPO_LLAMA3_Reasoning_Consultor

Commit History

Update README.md

78cda43
verified

alibidaran commited on Jul 29, 2025

Upload model trained with Unsloth

e15a211
verified

alibidaran commited on Jul 27, 2025

Upload model trained with Unsloth

3e4d5a7
verified

alibidaran commited on Jul 27, 2025

Upload README.md with huggingface_hub

68347d0
verified

alibidaran commited on Jul 27, 2025

initial commit

c1a1773
verified

alibidaran commited on Jul 27, 2025