ytaek-oh
/

fsc-clip

Zero-Shot Image Classification

Model card Files Files and versions

This repository contains the models of the paper Preserving Multi-Modal Capabilities of Pre-trained VLMs for Improving Vision-Linguistic Compositionality.

Downloads last month: -; Downloads are not tracked for this model. How to track

Collection including ytaek-oh/fsc-clip

FSC-CLIP

[EMNLP 2024] Preserving Multi-Modal Capabilities of Pre-trained VLMs for Improving Vision-Linguistic Compositionality • 5 items • Updated Oct 10, 2024

Paper for ytaek-oh/fsc-clip

Preserving Multi-Modal Capabilities of Pre-trained VLMs for Improving Vision-Linguistic Compositionality

Paper • 2410.05210 • Published Oct 7, 2024 • 11