mikeogezi
/

Qwen2-VL-2B-GRPO-MMR-Rationale

Generated from Trainer

text-generation-inference

Model card Files Files and versions

Qwen2-VL-2B-GRPO-MMR-Rationale / preprocessor_config.json

Commit History

Training in progress, step 20

864d8f4
verified

mikeogezi commited on Mar 1, 2025