Duplicated from DAMO-NLP-SG/VL3-SigLIP-NaViT

lb-sage
/

VL3-SigLIP-NaViT

Image Feature Extraction

videollama3_vision_encoder

feature-extraction

multi-modal-large-language-model

Model card Files Files and versions

VL3-SigLIP-NaViT

Ctrl+K

Ctrl+K

1 contributor

History: 2 commits

lb-sage's picture

fix(imports): fixes VideoInput import module for transformers

673a36d unverified 3 months ago