Neleac
/

SpaceTimeGPT

Video-Text-to-Text

vision-encoder-decoder

image-text-to-text

video-captioning

Eval Results (legacy)

Model card Files Files and versions

Neleac commited on Apr 22, 2023

Commit

bc77b51

·

1 Parent(s): 57596a7

README metadata

Files changed (1) hide show

README.md +14 -0

README.md CHANGED Viewed

@@ -1,8 +1,22 @@
 # TimeSformer-GPT2 Video Captioning
 Vision Encoder Model: [timesformer-base-finetuned-k600](https://huggingface.co/facebook/timesformer-base-finetuned-k600) \
 Text Decoder Model: [gpt2](https://huggingface.co/gpt2)
 #### Example Inference Code:
 ```python
 import av

+---
+datasets:
+- HuggingFaceM4/vatex
+language:
+- en
+metrics:
+- bleu
+- meteor
+- rouge
+pipeline_tag: image-to-text
+---
 # TimeSformer-GPT2 Video Captioning
 Vision Encoder Model: [timesformer-base-finetuned-k600](https://huggingface.co/facebook/timesformer-base-finetuned-k600) \
 Text Decoder Model: [gpt2](https://huggingface.co/gpt2)
+#### Evaluation Result:
+67.2 CIDEr on [VaTeX](https://eric-xw.github.io/vatex-website/index.html) public test set
 #### Example Inference Code:
 ```python
 import av