nlpconnect
/

vit-gpt2-image-captioning

vision-encoder-decoder

image-text-to-text

image-captioning

Model card Files Files and versions

Update README.md

#8

by itsog - opened Nov 27, 2022

base: refs/heads/main

←

from: refs/pr/8

Discussion Files changed

Files changed (1) hide show

README.md +2 -0

README.md CHANGED Viewed

@@ -29,6 +29,8 @@ This is an image captioning model trained by @ydshieh in [flax ](https://github.
 ```python
 from transformers import VisionEncoderDecoderModel, ViTFeatureExtractor, AutoTokenizer
 model = VisionEncoderDecoderModel.from_pretrained("nlpconnect/vit-gpt2-image-captioning")
 feature_extractor = ViTFeatureExtractor.from_pretrained("nlpconnect/vit-gpt2-image-captioning")

 ```python
 from transformers import VisionEncoderDecoderModel, ViTFeatureExtractor, AutoTokenizer
+import torch
+from PIL import Image
 model = VisionEncoderDecoderModel.from_pretrained("nlpconnect/vit-gpt2-image-captioning")
 feature_extractor = ViTFeatureExtractor.from_pretrained("nlpconnect/vit-gpt2-image-captioning")