kendallpark
/

maryVLM_bs256_gray_ms0_ds0

Image-Text-to-Text

vision-language

Model card Files Files and versions

nanoVLM is a minimal and lightweight Vision-Language Model (VLM).

Training Metadata

Checkpoint: 22000

Downloads last month: -