dadadar
/

Qwen2.5-1.5B-Open-R1-GRPO

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions

Qwen2.5-1.5B-Open-R1-GRPO

Commit History

Improve language tag

edefde4
verified

lbourdois commited on Apr 28, 2025

End of training

103bf83
verified

dadadar commited on Mar 28, 2025

Model save

d994b6f
verified

dadadar commited on Mar 28, 2025

Training in progress, epoch 1

60c4d60
verified

dadadar commited on Mar 28, 2025

initial commit

7abed5c
verified

dadadar commited on Mar 27, 2025