LlameUser
/

Qwen2.5-3B-Open-R1-GRPO

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions

Metrics Training metrics Community

Qwen2.5-3B-Open-R1-GRPO / runs

5.96 MB

1 contributor

History: 1 commit

LlameUser's picture

Training in progress, epoch 0

65bb676 verified 6 months ago