rasdani
/

Qwen2.5-0.5B-Open-R1-Code-GRPO

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions

Qwen2.5-0.5B-Open-R1-Code-GRPO / config.json

Commit History

End of training

fa92f59
verified

rasdani commited on Mar 8, 2025

Training in progress, step 100

a32dd19
verified

rasdani commited on Mar 8, 2025

Training in progress, step 50

aca93e1
verified

rasdani commited on Mar 8, 2025