Spaces:

Ishgan
/

LLAVA-API

Runtime error

Ishgan commited on Feb 3, 2025

Commit

8c1f0af

verified ·

1 Parent(s): 0aa5f77

Create app.py

Files changed (1) hide show

app.py ADDED Viewed

+import torch
+from transformers import LlavaProcessor, LlavaForConditionalGeneration
+import gradio as gr
+from PIL import Image
+# Load LLaVA model and processor
+model_id = "llava-hf/llava-1.5-7b"
+processor = LlavaProcessor.from_pretrained(model_id)
+model = LlavaForConditionalGeneration.from_pretrained(model_id, torch_dtype=torch.float16, device_map="auto")
+# Function to generate captions
+def generate_caption(image, prompt="Describe this image."):
+    inputs = processor(images=image, text=prompt, return_tensors="pt").to("cuda")
+    output = model.generate(**inputs, max_new_tokens=50)
+    return processor.batch_decode(output, skip_special_tokens=True)[0]
+# Gradio UI
+demo = gr.Interface(fn=generate_caption, inputs=[gr.Image(type="pil"), gr.Textbox()], outputs="text")
+demo.launch()