rkumar1999
/

Llama-3.2-3B-Open-R1-Distill-GRPO

Text Generation

Generated from Trainer

text-generation-inference

4-bit precision

Model card Files Files and versions

Llama-3.2-3B-Open-R1-Distill-GRPO / README.md

Commit History

End of training

32ade8a
verified

rkumar1999 commited on Apr 4, 2025

Model save

6dbd991
verified

rkumar1999 commited on Apr 4, 2025

Model save

5fb39bd
verified

rkumar1999 commited on Mar 16, 2025