alibidaran
/

GRPO_LLAMA3-instructive_reasoning1

text-generation-inference

Model card Files Files and versions

GRPO_LLAMA3-instructive_reasoning1

Commit History

Update README.md

7f79472
verified

alibidaran commited on Feb 2

Update README.md

4b72ea6
verified

alibidaran commited on Feb 2

Update README.md

8f849a1
verified

alibidaran commited on Feb 2

Update README.md

2ee3a58
verified

alibidaran commited on Feb 2

Update README.md

730f0f2
verified

alibidaran commited on Nov 13, 2025

Upload model trained with Unsloth

f9f7cda
verified

alibidaran commited on Jul 26, 2025

Upload model trained with Unsloth

0613edc
verified

alibidaran commited on Jul 26, 2025

Upload README.md with huggingface_hub

9f53583
verified

alibidaran commited on Jul 26, 2025

initial commit

b99e589
verified

alibidaran commited on Jul 26, 2025