ItsMaxNorm
/

Qwen2.5-1.5B-Open-R1-GRPO

Text Generation

Generated from Trainer

Model card Files Files and versions

Qwen2.5-1.5B-Open-R1-GRPO / tokenizer.json

Commit History

Training in progress, epoch 1

fbd66a6
verified

ItsMaxNorm commited on Aug 8, 2025