mikeogezi
/

Qwen2-VL-2B-GRPO-MMR-Rationale

Generated from Trainer

text-generation-inference

Model card Files Files and versions

Qwen2-VL-2B-GRPO-MMR-Rationale

Commit History

End of training

1da7a41
verified

mikeogezi commited on Mar 2, 2025

Model save

55452fb
verified

mikeogezi commited on Mar 2, 2025

Training in progress, step 62

f002acd
verified

mikeogezi commited on Mar 2, 2025

Training in progress, step 60

ec1c7d4
verified

mikeogezi commited on Mar 2, 2025

Training in progress, step 50

cceb6ea
verified

mikeogezi commited on Mar 2, 2025

Training in progress, step 40

2777b46
verified

mikeogezi commited on Mar 2, 2025

Training in progress, step 30

64eac35
verified

mikeogezi commited on Mar 2, 2025

Training in progress, step 20

864d8f4
verified

mikeogezi commited on Mar 1, 2025

initial commit

bd0be01
verified

mikeogezi commited on Mar 1, 2025