dadadar
/

Qwen2.5-3B-Open-R1-GRPO

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions

Qwen2.5-3B-Open-R1-GRPO

Commit History

Improve language tag

ba22d4f
verified

lbourdois commited on Apr 28, 2025

End of training

366b540
verified

dadadar commited on Mar 26, 2025

Model save

1a8d880
verified

dadadar commited on Mar 26, 2025

Training in progress, epoch 1

2130eee
verified

dadadar commited on Mar 26, 2025

initial commit

102fc88
verified

dadadar commited on Mar 24, 2025