Spaces:

gladikos
/

mage-caption-bot

Runtime error

App Files Files Community

gladikos commited on Apr 1, 2025

Commit

fe86529

verified ·

1 Parent(s): 73a7531

Delete app.py

Browse files

Files changed (1) hide show

app.py +0 -62

app.py DELETED Viewed

@@ -1,62 +0,0 @@
-import gradio as gr
-from PIL import Image
-from transformers import (
-    BlipProcessor, BlipForConditionalGeneration,
-    MarianTokenizer, MarianMTModel
-)
-import torch
-import base64
-from io import BytesIO
-device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
-# Bildbeschreibung (BLIP)
-processor = BlipProcessor.from_pretrained("Salesforce/blip-image-captioning-base")
-model = BlipForConditionalGeneration.from_pretrained("Salesforce/blip-image-captioning-base").to(device)
-# Übersetzung EN → DE (Helsinki)
-translation_model_name = "Helsinki-NLP/opus-mt-en-de"
-translator_tokenizer = MarianTokenizer.from_pretrained(translation_model_name)
-translator_model = MarianMTModel.from_pretrained(translation_model_name).to(device)
-# Hilfsfunktion: Bild als HTML Thumbnail
-def image_to_base64_html(img):
-    buffered = BytesIO()
-    img.save(buffered, format="PNG")
-    img_str = base64.b64encode(buffered.getvalue()).decode()
-    html = f'<img src="data:image/png;base64,{img_str}" width="150"/>'
-    return html
-# Bildbeschreibung + Übersetzung
-def describe_image_with_translation(image, history):
-    if image is None:
-        return history
-    # EN: Bildbeschreibung
-    inputs = processor(images=image, return_tensors="pt").to(device)
-    output = model.generate(**inputs)
-    caption_en = processor.decode(output[0], skip_special_tokens=True)
-    # Übersetzen nach DE
-    tokens = translator_tokenizer(caption_en, return_tensors="pt", padding=True).to(device)
-    translated_ids = translator_model.generate(**tokens)
-    caption_de = translator_tokenizer.decode(translated_ids[0], skip_special_tokens=True)
-    # Bild als Thumbnail
-    image_html = image_to_base64_html(image)
-    # Chatverlauf aktualisieren
-    history.append((image_html, caption_de))
-    return history
-# Gradio UI
-with gr.Blocks() as demo:
-    gr.Markdown("## 🇩🇪 KI-Chat: Automatische Bildbeschreibung auf Deutsch")
-    chatbot = gr.Chatbot(label="Bild-zu-Text (DE)")
-    with gr.Row():
-        image_input = gr.Image(type="pil", label="Bild hier hochladen")
-        btn = gr.Button("Bild beschreiben")
-    btn.click(fn=describe_image_with_translation, inputs=[image_input, chatbot], outputs=chatbot)
-demo.launch()