comparing-VQA-models

Runtime error

App Files Files Community

rjiang12 commited on Aug 8, 2023

Commit

de2dda2

1 Parent(s): f2a60c9

Update app.py

Browse files

Files changed (1) hide show

app.py +8 -8

app.py CHANGED Viewed

@@ -9,14 +9,14 @@ torch.hub.download_url_to_file('https://cdn.openai.com/dall-e-2/demos/text2im/as
 git_processor_base = AutoProcessor.from_pretrained("microsoft/git-base-vqav2")
 git_model_base = AutoModelForCausalLM.from_pretrained("microsoft/git-base-vqav2")
-git_processor_large = AutoProcessor.from_pretrained("microsoft/git-large-vqav2")
-git_model_large = AutoModelForCausalLM.from_pretrained("microsoft/git-large-vqav2")
 blip_processor_base = AutoProcessor.from_pretrained("Salesforce/blip-vqa-base")
 blip_model_base = BlipForQuestionAnswering.from_pretrained("Salesforce/blip-vqa-base")
-blip_processor_large = AutoProcessor.from_pretrained("Salesforce/blip-vqa-capfilt-large")
-blip_model_large = BlipForQuestionAnswering.from_pretrained("Salesforce/blip-vqa-capfilt-large")
 vilt_processor = AutoProcessor.from_pretrained("dandelin/vilt-b32-finetuned-vqa")
 vilt_model = ViltForQuestionAnswering.from_pretrained("dandelin/vilt-b32-finetuned-vqa")
@@ -25,8 +25,8 @@ device = "cuda" if torch.cuda.is_available() else "cpu"
 git_model_base.to(device)
 blip_model_base.to(device)
-git_model_large.to(device)
-blip_model_large.to(device)
 vilt_model.to(device)
 def generate_answer_git(processor, model, image, question):
@@ -72,11 +72,11 @@ def generate_answer_vilt(processor, model, image, question):
 def generate_answers(image, question):
     answer_git_base = generate_answer_git(git_processor_base, git_model_base, image, question)
-    answer_git_large = generate_answer_git(git_processor_large, git_model_large, image, question)
     answer_blip_base = generate_answer_blip(blip_processor_base, blip_model_base, image, question)
-    answer_blip_large = generate_answer_blip(blip_processor_large, blip_model_large, image, question)
     answer_vilt = generate_answer_vilt(vilt_processor, vilt_model, image, question)

 git_processor_base = AutoProcessor.from_pretrained("microsoft/git-base-vqav2")
 git_model_base = AutoModelForCausalLM.from_pretrained("microsoft/git-base-vqav2")
+# git_processor_large = AutoProcessor.from_pretrained("microsoft/git-large-vqav2")
+# git_model_large = AutoModelForCausalLM.from_pretrained("microsoft/git-large-vqav2")
 blip_processor_base = AutoProcessor.from_pretrained("Salesforce/blip-vqa-base")
 blip_model_base = BlipForQuestionAnswering.from_pretrained("Salesforce/blip-vqa-base")
+# blip_processor_large = AutoProcessor.from_pretrained("Salesforce/blip-vqa-capfilt-large")
+# blip_model_large = BlipForQuestionAnswering.from_pretrained("Salesforce/blip-vqa-capfilt-large")
 vilt_processor = AutoProcessor.from_pretrained("dandelin/vilt-b32-finetuned-vqa")
 vilt_model = ViltForQuestionAnswering.from_pretrained("dandelin/vilt-b32-finetuned-vqa")
 git_model_base.to(device)
 blip_model_base.to(device)
+#git_model_large.to(device)
+#blip_model_large.to(device)
 vilt_model.to(device)
 def generate_answer_git(processor, model, image, question):
 def generate_answers(image, question):
     answer_git_base = generate_answer_git(git_processor_base, git_model_base, image, question)
+    # answer_git_large = generate_answer_git(git_processor_large, git_model_large, image, question)
     answer_blip_base = generate_answer_blip(blip_processor_base, blip_model_base, image, question)
+    # answer_blip_large = generate_answer_blip(blip_processor_large, blip_model_large, image, question)
     answer_vilt = generate_answer_vilt(vilt_processor, vilt_model, image, question)