LlameUser
/

Qwen2.5-3B-Open-R1-GRPO

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions

Metrics Training metrics Community

Qwen2.5-3B-Open-R1-GRPO

Commit History

End of training

4cb9538
verified

LlameUser commited on Sep 1, 2025

Model save

0e1ca88
verified

LlameUser commited on Sep 1, 2025

Training in progress, epoch 0

65bb676
verified

LlameUser commited on Sep 1, 2025

initial commit

44808ff
verified

LlameUser commited on Aug 27, 2025