Lansechen
/

Qwen2.5-3B-Open-R1-GRPO-math-selected-default

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions

Qwen2.5-3B-Open-R1-GRPO-math-selected-default

Commit History

Improve language tag

96fc0a0
verified

lbourdois commited on Apr 27, 2025

End of training

f4a0f61
verified

Lansechen commited on Apr 12, 2025

Model save

dfe2499
verified

Lansechen commited on Apr 12, 2025

Training in progress, epoch 1

71a07c5
verified

Lansechen commited on Apr 12, 2025

Training in progress, epoch 0

3f8aded
verified

Lansechen commited on Apr 12, 2025

initial commit

9cc3e67
verified

Lansechen commited on Apr 12, 2025