Lansechen
/

Qwen2.5-7B-Open-R1-GRPO-math-selected-default

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions

Qwen2.5-7B-Open-R1-GRPO-math-selected-default

Commit History

Improve language tag

ca0986d
verified

lbourdois commited on Apr 27, 2025

End of training

f04c0be
verified

Lansechen commited on Apr 24, 2025

Model save

b0e2550
verified

Lansechen commited on Apr 24, 2025

Training in progress, epoch 1

2e43b55
verified

Lansechen commited on Apr 24, 2025

Training in progress, epoch 0

b9442f1
verified

Lansechen commited on Apr 24, 2025

initial commit

33ce925
verified

Lansechen commited on Apr 24, 2025