Dongwei
/

Qwen2.5-1.5B-Open-R1-GRPO_Math_smalllr

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions

Qwen2.5-1.5B-Open-R1-GRPO_Math_smalllr

Commit History

End of training

578adc4
verified

Dongwei commited on Feb 4, 2025

Model save

035ae8a
verified

Dongwei commited on Feb 4, 2025

initial commit

d0804f4
verified

Dongwei commited on Feb 4, 2025