Spaces:

omarkashif
/

ImageCaption

Sleeping

omarkashif commited on May 13, 2025

Commit

00c6c1d

verified ·

1 Parent(s): 8c2a76f

Create app.py

Files changed (1) hide show

app.py ADDED Viewed

+import gradio as gr
+from transformers import BlipProcessor, BlipForConditionalGeneration
+from PIL import Image
+import torch
+device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
+# Load fine-tuned model from HF Hub
+model = BlipForConditionalGeneration.from_pretrained("omarkashif/blip-finetuned-flickr30k").to(device)
+processor = BlipProcessor.from_pretrained("omarkashif/blip-finetuned-flickr30k")
+def generate_caption(image):
+    image = image.convert("RGB")
+    inputs = processor(images=image, return_tensors="pt").to(device)
+    with torch.no_grad():
+        output = model.generate(**inputs, max_length=40, num_beams=5)
+    caption = processor.decode(output[0], skip_special_tokens=True)
+    return caption
+# Gradio UI
+gr.Interface(
+    fn=generate_caption,
+    inputs=gr.Image(type="pil"),
+    outputs="text",
+    title="BLIP Fine-Tuned Caption Generator",
+    description="Upload an image to generate a caption using a BLIP model fine-tuned on Flickr30k."
+).launch()