OFA-Sys
/

ofa-base

Transformers

PyTorch

ofa

Model card Files Files and versions

xet

Community

JustinLin610 commited on Jul 25, 2022

Commit

c1aa9ef

1 Parent(s): c4bac4c

Update README.md

Browse files

Files changed (1) hide show

README.md +22 -5

README.md CHANGED Viewed

@@ -15,10 +15,12 @@ git clone https://huggingface.co/OFA-Sys/OFA-base
 ```
 After, refer the path to OFA-base to `ckpt_dir`, and prepare an image for the testing example below. Also, ensure that you have pillow and torchvision in your environment.
 ```
 >>> from PIL import Image
 >>> from torchvision import transforms
->>> from transformers import OFATokenizer, OFAForConditionalGeneration
 >>> mean, std = [0.5, 0.5, 0.5], [0.5, 0.5, 0.5]
 >>> resolution = 384
@@ -29,14 +31,29 @@ After, refer the path to OFA-base to `ckpt_dir`, and prepare an image for the te
         transforms.Normalize(mean=mean, std=std)
     ])
->>> model = OFAForConditionalGeneration.from_pretrained(ckpt_dir)
 >>> tokenizer = OFATokenizer.from_pretrained(ckpt_dir)
->>> txt = " what is the description of the image?"
->>> inputs = tokenizer([txt], max_length=1024, return_tensors="pt")["input_ids"]
 >>> img = Image.open(path_to_image)
 >>> patch_img = patch_resize_transform(img).unsqueeze(0)
->>> gen = model.generate(inputs, patch_images=patch_img, num_beams=4)
 >>> print(tokenizer.batch_decode(gen, skip_special_tokens=True))
 ```

 ```
 After, refer the path to OFA-base to `ckpt_dir`, and prepare an image for the testing example below. Also, ensure that you have pillow and torchvision in your environment.
 ```
 >>> from PIL import Image
 >>> from torchvision import transforms
+>>> from transformers import OFATokenizer, OFAModel
+>>> from generate import sequence_generator
 >>> mean, std = [0.5, 0.5, 0.5], [0.5, 0.5, 0.5]
 >>> resolution = 384
         transforms.Normalize(mean=mean, std=std)
     ])
 >>> tokenizer = OFATokenizer.from_pretrained(ckpt_dir)
+>>> txt = " what does the image describe?"
+>>> inputs = tokenizer([txt], return_tensors="pt").input_ids
 >>> img = Image.open(path_to_image)
 >>> patch_img = patch_resize_transform(img).unsqueeze(0)
+>>> # using the generator of fairseq version
+>>> model = OFAModel.from_pretrained(ckpt_dir, use_cache=True)
+>>> generator = sequence_generator.SequenceGenerator(tokenizer=tokenizer,beam_size=5,
+                                                                      max_len_b=16,
+                                                                      min_len=0,
+                                                                      no_repeat_ngram_size=3) # using the generator of fairseq version
+>>> data = {}
+>>> data["net_input"] = {"input_ids": inputs, 'patch_images': patch_img, 'patch_masks':torch.tensor([True])}
+>>> gen_output = generator.generate([model], data)
+>>> gen = [gen_output[i][0]["tokens"] for i in range(len(gen_output))]
+>>> # using the generator of huggingface version
+>>> model = OFAModel.from_pretrained(ckpt_dir, use_cache=False)
+>>> gen = model.generate(inputs, patch_images=patch_img, num_beams=5, no_repeat_ngram_size=3)
 >>> print(tokenizer.batch_decode(gen, skip_special_tokens=True))
 ```