DAMO-NLP-SG
/

VideoLLaMA2-7B-Base

Visual Question Answering

videollama2_mistral

text-generation

multimodal large language model

large video-language model

Model card Files Files and versions

fix task tag

#1

by merve HF Staff - opened Aug 24, 2024

base: refs/heads/main

←

from: refs/pr/1

Discussion Files changed

Files changed (1) hide show

README.md +2 -3

README.md CHANGED Viewed

@@ -9,7 +9,7 @@ language:
 metrics:
 - accuracy
 library_name: transformers
-pipeline_tag: visual-question-answering
 tags:
 - multimodal large language model
 - large video-language model
@@ -106,5 +106,4 @@ If you find VideoLLaMA useful for your research and applications, please cite us
   year = {2023},
   url = {https://arxiv.org/abs/2306.02858}
 }
-```

 metrics:
 - accuracy
 library_name: transformers
+pipeline_tag: video-text-to-text
 tags:
 - multimodal large language model
 - large video-language model
   year = {2023},
   url = {https://arxiv.org/abs/2306.02858}
 }
+```