Spaces:

yashsharmaa
/

CIRChat

Sleeping

yashsharmaa commited on Apr 21, 2025

Commit

a982e1b

verified ·

1 Parent(s): 97708b6

Update models/caption.py

Files changed (1) hide show

models/caption.py CHANGED Viewed

@@ -1,14 +1,14 @@
-from transformers import BlipProcessor, BlipForConditionalGeneration
-import torch
-# Load BLIP model and processor once
-processor = BlipProcessor.from_pretrained("Salesforce/blip-image-captioning-base")
-model = BlipForConditionalGeneration.from_pretrained("Salesforce/blip-image-captioning-base").to("cuda")
-@torch.no_grad()
-def generate_caption(image):
-    inputs = processor(images=image, return_tensors="pt").to("cuda")
-    output = model.generate(**inputs, max_new_tokens=50)
-    caption = processor.tokenizer.decode(output[0], skip_special_tokens=True)
-    return caption

+from transformers import BlipProcessor, BlipForConditionalGeneration
+import torch
+device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
+processor = BlipProcessor.from_pretrained("Salesforce/blip-image-captioning-base")
+model = BlipForConditionalGeneration.from_pretrained("Salesforce/blip-image-captioning-base").to(device)
+@torch.no_grad()
+def generate_caption(image):
+    inputs = processor(images=image, return_tensors="pt").to(device)
+    output = model.generate(**inputs, max_new_tokens=50)
+    caption = processor.tokenizer.decode(output[0], skip_special_tokens=True)
+    return caption