May811
/

Qwen2.5-1.5B-Open-R1-GRPO

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions

Qwen2.5-1.5B-Open-R1-GRPO / trainer_state.json

Commit History

Model save

9afce01
verified

May811 commited on Feb 15, 2025

Model save

e3b8fb1
verified

May811 commited on Feb 15, 2025

Model save

21707f8
verified

May811 commited on Feb 14, 2025