howardzhou
/

Qwen2.5-3B-Open-R1-GRPO

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions

Metrics Training metrics Community

Qwen2.5-3B-Open-R1-GRPO / runs

440 kB

Ctrl+K

Ctrl+K

1 contributor

History: 18 commits

howardzhou's picture

Training in progress, step 646

86cc73b verified about 1 year ago