iioos
/

multimodal-caption-model

vision-language

Model card Files Files and versions

multimodal-caption-model

File size: 183 Bytes

b2bb309

---
language: en
license: mit
tags:
- multimodal
- vision-language
- captioning
---

# Multimodal Caption Model

A model designed to generate textual descriptions from visual inputs.