ASID-Caption

community

https://asid-caption.github.io/

AI & ML interests

Video Understanding, Audio-Visual, Multimodal LLMs, Video Captioning, Instruction Tuning, Dataset Curation, Qwen-based, Open-source, Fully-Open-MLLMs

Papers

Towards Universal Video MLLMs with Attribute-Structured and Quality-Verified Instructions

View all Papers

AudioVisual-Caption 's models 2

AudioVisual-Caption/ASID-Captioner-7B

Image-Text-to-Text • 9B • Updated Mar 11 • 18 • 7

AudioVisual-Caption/ASID-Captioner-3B

Image-Text-to-Text • 5B • Updated Mar 11 • 8 • 37