FutureMa
/

Qwen2.5-7B-Instruct-GRPO-Math

Text Generation

Model card Files Files and versions

Qwen2.5-7B-Instruct-GRPO-Math / optimizer.pt

Commit History

Upload GRPO fine-tuned Qwen2.5-7B-Instruct model

bc4cc58
verified

FutureMa commited on 28 days ago