wlzhou
/

Qwen2.5-1.5B-Open-R1-GRPO

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions

Qwen2.5-1.5B-Open-R1-GRPO / tokenizer.json

Commit History

Training in progress, step 50

481c277
verified

wlzhou commited on Mar 4, 2025

Model save

5f62e38
verified

wlzhou commited on Mar 4, 2025

Training in progress, step 50

843c67f
verified

wlzhou commited on Mar 4, 2025