Vision
updated
liuhaotian/llava-v1.6-34b
Image-Text-to-Text
•
35B
•
Updated
•
20.6k
•
358
deepseek-ai/deepseek-vl-7b-base
7B
•
Updated
•
315
•
64
deepseek-ai/deepseek-vl-7b-chat
Image-Text-to-Text
•
7B
•
Updated
•
5.82k
•
269
HuggingFaceM4/idefics2-8b
Image-Text-to-Text
•
8B
•
Updated
•
65.1k
•
620
HuggingFaceM4/idefics2-8b-chatty
Image-Text-to-Text
•
8B
•
Updated
•
165
•
95
HuggingFaceM4/idefics2-8b-base
Image-Text-to-Text
•
8B
•
Updated
•
1.05k
•
28
google/paligemma-3b-pt-896
Image-Text-to-Text
•
3B
•
Updated
•
284
•
123
microsoft/Phi-3-vision-128k-instruct
Text Generation
•
4B
•
Updated
•
63.8k
•
971
Image-Text-to-Text
•
7B
•
Updated
•
54.3k
•
196
microsoft/Phi-3.5-vision-instruct
Image-Text-to-Text
•
4B
•
Updated
•
577k
•
726
meta-llama/Llama-3.2-11B-Vision
Image-Text-to-Text
•
11B
•
Updated
•
11.4k
•
580
meta-llama/Llama-3.2-11B-Vision-Instruct
Image-Text-to-Text
•
11B
•
Updated
•
181k
•
•
1.56k
meta-llama/Llama-3.2-90B-Vision
Image-Text-to-Text
•
89B
•
Updated
•
2.51k
•
133
meta-llama/Llama-3.2-90B-Vision-Instruct
Image-Text-to-Text
•
89B
•
Updated
•
2.51k
•
•
349
meta-llama/Llama-Guard-3-11B-Vision
Image-Text-to-Text
•
11B
•
Updated
•
671
•
67
Image-Text-to-Text
•
73B
•
Updated
•
4.75k
•
296
Image-Text-to-Text
•
8B
•
Updated
•
16.1k
•
564
Image-Text-to-Text
•
8B
•
Updated
•
1.46k
•
163
Image-Text-to-Text
•
Updated
•
800
•
156
Text-to-Video
•
Updated
•
2.57k
•
•
1.3k
Image-Text-to-Text
•
Updated
•
322
•
1.71k
Image-to-Video
•
Updated
•
226k
•
•
2.11k