OX-PIXL
/

SpatialThinker-3B

Image-Text-to-Text

spatial-reasoning

vision-language

reinforcement-learning

Model card Files Files and versions

hunarbatra commited on Nov 12, 2025

Commit

aec53bb

·

verified ·

1 Parent(s): 3358e8b

Create README.md

Files changed (1) hide show

README.md +7 -0

README.md ADDED Viewed

	@@ -0,0 +1,7 @@

+---
+datasets:
+- OX-PIXL/STVQA-7K
+base_model:
+- Qwen/Qwen2.5-VL-3B-Instruct
+---
+Paper: https://arxiv.org/abs/2511.07403