Mingsmilet
/

Qwen2.5-1.5B-R1-Distill-GRPO-Math

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions

Qwen2.5-1.5B-R1-Distill-GRPO-Math / tokenizer.json

Commit History

Training in progress, step 500

8894c05
verified

Mingsmilet commited on Mar 5