dadadar
/

Qwen2.5-3B-Open-R1-GRPO

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions

Qwen2.5-3B-Open-R1-GRPO

Commit History

End of training

366b540
verified

dadadar commited on Mar 26, 2025

Model save

1a8d880
verified

dadadar commited on Mar 26, 2025

Training in progress, epoch 1

2130eee
verified

dadadar commited on Mar 26, 2025

initial commit

102fc88
verified

dadadar commited on Mar 24, 2025