multimodal-caption-model / README.md

Create README.md

b2bb309 verified 5 days ago

183 Bytes

metadata

language: en
license: mit
tags:
  - multimodal
  - vision-language
  - captioning

Multimodal Caption Model

A model designed to generate textual descriptions from visual inputs.