Spaces:

TimInf
/

ReGe

Runtime error

File size: 17,986 Bytes

1787e4b
d71c8ab
1787e4b
 
 
d027733
1787e4b
bcc13b5
1787e4b
 
 
bcc13b5
1787e4b
bcc13b5
1787e4b
 
 
 
bcc13b5
d71c8ab
 
 
 
 
1787e4b
d71c8ab
bcc13b5
d71c8ab
 
 
 
bcc13b5
d71c8ab
 
 
 
 
 
 
 
 
bcc13b5
d71c8ab
 
 
 
bcc13b5
d71c8ab
 
 
 
 
bcc13b5
d71c8ab
 
 
 
 
 
 
bcc13b5
d71c8ab
 
 
 
 
 
bcc13b5
d71c8ab
 
 
bcc13b5
d71c8ab
 
bcc13b5
d71c8ab
 
 
 
bcc13b5
d71c8ab
 
 
 
bcc13b5
d71c8ab
 
 
 
 
bcc13b5
d71c8ab
bcc13b5
d71c8ab
 
 
bcc13b5
d71c8ab
 
 
 
bcc13b5
d71c8ab
bcc13b5
d71c8ab
 
 
bcc13b5
d71c8ab
 
 
bcc13b5
d71c8ab
 
 
bcc13b5
d71c8ab
 
bcc13b5
d71c8ab
 
bcc13b5
d71c8ab
bcc13b5
d71c8ab
 
bcc13b5
d71c8ab
 
bcc13b5
d71c8ab
 
 
bcc13b5
d71c8ab
 
bcc13b5
d71c8ab
 
bcc13b5
d71c8ab
 
bcc13b5
d71c8ab
 
 
bcc13b5
d71c8ab
 
 
 
 
bcc13b5
d71c8ab
 
 
 
 
 
 
 
 
 
 
 
 
 
 
bcc13b5
 
 
d71c8ab
 
 
 
 
bcc13b5
d71c8ab
 
 
 
bcc13b5
d71c8ab
 
 
 
 
 
bcc13b5
d71c8ab
 
 
bcc13b5
d71c8ab
 
 
 
 
 
 
bcc13b5
d71c8ab
bcc13b5
d71c8ab
 
 
 
 
 
 
 
bcc13b5
d71c8ab
 
 
 
 
 
bcc13b5
d71c8ab
 
 
 
 
 
bcc13b5
d71c8ab
 
 
 
 
 
 
 
 
 
 
 
 
bcc13b5
d71c8ab
bcc13b5
d71c8ab
bcc13b5
d71c8ab
 
 
bcc13b5
d71c8ab
bcc13b5
d71c8ab
bcc13b5
d71c8ab
 
bcc13b5
d71c8ab
bcc13b5
d71c8ab
 
 
bcc13b5
d71c8ab
 
bcc13b5
d71c8ab
bcc13b5
d71c8ab
 
bcc13b5
d71c8ab
bcc13b5
d71c8ab
bcc13b5
d71c8ab
 
d027733
 
88f38f2
d71c8ab
88f38f2
 
d71c8ab
88f38f2
 
bcc13b5
88f38f2
bcc13b5
1787e4b
 
bcc13b5
1787e4b
 
bcc13b5
 
1787e4b
bcc13b5
88f38f2
d71c8ab
 
bcc13b5
d71c8ab
 
 
88f38f2
bcc13b5
88f38f2
 
 
d027733
88f38f2
d027733
 
88f38f2
 
d027733
 
88f38f2
 
 
 
 
 
 
 
 
 
d027733
bcc13b5
d71c8ab
d027733
 
 
d71c8ab
bcc13b5
 
d71c8ab
 
 
bcc13b5
88f38f2
 
 
 
bcc13b5
d71c8ab
 
bcc13b5
d71c8ab
 
 
bcc13b5
1787e4b
d71c8ab
bcc13b5
1787e4b
 
 
bcc13b5
1787e4b
d027733
bcc13b5
 
 
 
 
 
 
 
d71c8ab
 
 
bcc13b5
 
d71c8ab
 
 
bcc13b5
 
d71c8ab
 
bcc13b5
 
 
 
 
d71c8ab
bcc13b5
 
 
 
 
 
 
88f38f2
bcc13b5
 
 
 
d027733
 
bcc13b5
d71c8ab
d027733
d71c8ab
 
 
bcc13b5
 
 
d71c8ab
 
 
beaa316
d027733
d71c8ab
bcc13b5
d71c8ab
 
 
 
 
 
 
1787e4b
d027733

import gradio as gr
from transformers import FlaxAutoModelForSeq2SeqLM, AutoTokenizer, AutoModel
import torch
import numpy as np
import random
import json # Beibehalten, da es in flutter_api_generate_recipe verwendet wird

# Lade RecipeBERT Modell (für semantische Zutat-Kombination)
bert_model_name = "alexdseo/RecipeBERT"
bert_tokenizer = AutoTokenizer.from_pretrained(bert_model_name)
bert_model = AutoModel.from_pretrained(bert_model_name)
bert_model.eval() # Setze das Modell in den Evaluationsmodus

# Lade T5 Rezeptgenerierungsmodell
MODEL_NAME_OR_PATH = "flax-community/t5-recipe-generation"
t5_tokenizer = AutoTokenizer.from_pretrained(MODEL_NAME_OR_PATH, use_fast=True)
t5_model = FlaxAutoModelForSeq2SeqLM.from_pretrained(MODEL_NAME_OR_PATH)

# Token Mapping für die T5 Modell-Ausgabe
special_tokens = t5_tokenizer.all_special_tokens
tokens_map = {
    "<sep>": "--",
    "<section>": "\n"
}

def get_embedding(text):
    """Berechnet das Embedding für einen Text mit Mean Pooling über alle Tokens"""
    inputs = bert_tokenizer(text, return_tensors="pt", truncation=True, padding=True)
    with torch.no_grad():
        outputs = bert_model(**inputs)

    # Mean Pooling - Mittelwert aller Token-Embeddings
    attention_mask = inputs['attention_mask']
    token_embeddings = outputs.last_hidden_state
    input_mask_expanded = attention_mask.unsqueeze(-1).expand(token_embeddings.size()).float()
    sum_embeddings = torch.sum(token_embeddings * input_mask_expanded, 1)
    sum_mask = torch.clamp(input_mask_expanded.sum(1), min=1e-9)

    return (sum_embeddings / sum_mask).squeeze(0)

def average_embedding(embedding_list):
    """Berechnet den Durchschnitt einer Liste von Embeddings"""
    tensors = torch.stack([emb for _, emb in embedding_list])
    return tensors.mean(dim=0)

def get_cosine_similarity(vec1, vec2):
    """Berechnet die Cosinus-Ähnlichkeit zwischen zwei Vektoren"""
    if torch.is_tensor(vec1):
        vec1 = vec1.detach().numpy()
    if torch.is_tensor(vec2):
        vec2 = vec2.detach().numpy()

    # Stelle sicher, dass die Vektoren die richtige Form haben (flachen sie bei Bedarf ab)
    vec1 = vec1.flatten()
    vec2 = vec2.flatten()

    dot_product = np.dot(vec1, vec2)
    norm_a = np.linalg.norm(vec1)
    norm_b = np.linalg.norm(vec2)

    # Division durch Null vermeiden
    if norm_a == 0 or norm_b == 0:
        return 0

    return dot_product / (norm_a * norm_b)

def get_combined_scores(query_vector, embedding_list, all_good_embeddings, avg_weight=0.6):
    """Berechnet einen kombinierten Score unter Berücksichtigung der Ähnlichkeit zum Durchschnitt und zu einzelnen Zutaten"""
    results = []

    for name, emb in embedding_list:
        # Ähnlichkeit zum Durchschnittsvektor
        avg_similarity = get_cosine_similarity(query_vector, emb)

        # Durchschnittliche Ähnlichkeit zu einzelnen Zutaten
        individual_similarities = [get_cosine_similarity(good_emb, emb)
                                   for _, good_emb in all_good_embeddings]
        avg_individual_similarity = sum(individual_similarities) / len(individual_similarities)

        # Kombinierter Score (gewichteter Durchschnitt)
        combined_score = avg_weight * avg_similarity + (1 - avg_weight) * avg_individual_similarity

        results.append((name, emb, combined_score))

    # Sortiere nach kombiniertem Score (absteigend)
    results.sort(key=lambda x: x[2], reverse=True)
    return results

def find_best_ingredients(required_ingredients, available_ingredients, max_ingredients=6, avg_weight=0.6):
    """
    Findet die besten Zutaten basierend auf RecipeBERT Embeddings.
    """
    # Stelle sicher, dass keine Duplikate in den Listen sind
    required_ingredients = list(set(required_ingredients))
    available_ingredients = list(set([i for i in available_ingredients if i not in required_ingredients]))

    # Sonderfall: Wenn keine benötigten Zutaten vorhanden sind, wähle zufällig eine aus den verfügbaren Zutaten
    if not required_ingredients and available_ingredients:
        random_ingredient = random.choice(available_ingredients)
        required_ingredients = [random_ingredient]
        available_ingredients = [i for i in available_ingredients if i != random_ingredient]
        # print(f"Keine benötigten Zutaten angegeben. Zufällig ausgewählt: {random_ingredient}")

    # Wenn immer noch keine Zutaten vorhanden oder bereits maximale Kapazität erreicht ist
    if not required_ingredients or len(required_ingredients) >= max_ingredients:
        return required_ingredients[:max_ingredients]

    # Wenn keine zusätzlichen Zutaten verfügbar sind
    if not available_ingredients:
        return required_ingredients

    # Berechne Embeddings für alle Zutaten
    embed_required = [(e, get_embedding(e)) for e in required_ingredients]
    embed_available = [(e, get_embedding(e)) for e in available_ingredients]

    # Anzahl der hinzuzufügenden Zutaten
    num_to_add = min(max_ingredients - len(required_ingredients), len(available_ingredients))

    # Kopiere benötigte Zutaten in die endgültige Liste
    final_ingredients = embed_required.copy()

    # Füge die besten Zutaten hinzu
    for _ in range(num_to_add):
        # Berechne den Durchschnittsvektor der aktuellen Kombination
        avg = average_embedding(final_ingredients)

        # Berechne kombinierte Scores für alle Kandidaten
        candidates = get_combined_scores(avg, embed_available, final_ingredients, avg_weight)

        # Wenn keine Kandidaten mehr übrig sind, breche ab
        if not candidates:
            break

        # Wähle die beste Zutat
        best_name, best_embedding, _ = candidates[0]

        # Füge die beste Zutat zur endgültigen Liste hinzu
        final_ingredients.append((best_name, best_embedding))

        # Entferne die Zutat aus den verfügbaren Zutaten
        embed_available = [item for item in embed_available if item[0] != best_name]

    # Extrahiere nur die Zutatennamen
    return [name for name, _ in final_ingredients]

def skip_special_tokens(text, special_tokens):
    """Entfernt spezielle Tokens aus dem Text"""
    for token in special_tokens:
        text = text.replace(token, "")
    return text

def target_postprocessing(texts, special_tokens):
    """Post-processed generierten Text"""
    if not isinstance(texts, list):
        texts = [texts]

    new_texts = []
    for text in texts:
        text = skip_special_tokens(text, special_tokens)

        for k, v in tokens_map.items():
            text = text.replace(k, v)

        new_texts.append(text)

    return new_texts

def validate_recipe_ingredients(recipe_ingredients, expected_ingredients, tolerance=0):
    """
    Validiert, ob das Rezept ungefähr die erwarteten Zutaten enthält.
    """
    recipe_count = len([ing for ing in recipe_ingredients if ing and ing.strip()])
    expected_count = len(expected_ingredients)
    return abs(recipe_count - expected_count) == tolerance

def generate_recipe_with_t5(ingredients_list, max_retries=5):
    """Generiert ein Rezept mit dem T5 Rezeptgenerierungsmodell mit Validierung."""
    original_ingredients = ingredients_list.copy()

    for attempt in range(max_retries):
        try:
            # Für Wiederholungsversuche nach dem ersten Versuch, mische die Zutaten
            if attempt > 0:
                current_ingredients = original_ingredients.copy()
                random.shuffle(current_ingredients)
            else:
                current_ingredients = ingredients_list

            # Formatiere Zutaten als kommaseparierten String
            ingredients_string = ", ".join(current_ingredients)
            prefix = "items: "

            # Generationseinstellungen
            generation_kwargs = {
                "max_length": 512,
                "min_length": 64,
                "do_sample": True,
                "top_k": 60,
                "top_p": 0.95
            }
            # print(f"Versuch {attempt + 1}: {prefix + ingredients_string}")

            # Tokenisiere Eingabe
            inputs = t5_tokenizer(
                prefix + ingredients_string,
                max_length=256,
                padding="max_length",
                truncation=True,
                return_tensors="jax"
            )

            # Generiere Text
            output_ids = t5_model.generate(
                input_ids=inputs.input_ids,
                attention_mask=inputs.attention_mask,
                **generation_kwargs
            )

            # Dekodieren und Nachbearbeiten
            generated = output_ids.sequences
            generated_text = target_postprocessing(
                t5_tokenizer.batch_decode(generated, skip_special_tokens=False),
                special_tokens
            )[0]

            # Abschnitte parsen
            recipe = {}
            sections = generated_text.split("\n")
            for section in sections:
                section = section.strip()
                if section.startswith("title:"):
                    recipe["title"] = section.replace("title:", "").strip().capitalize()
                elif section.startswith("ingredients:"):
                    ingredients_text = section.replace("ingredients:", "").strip()
                    recipe["ingredients"] = [item.strip().capitalize() for item in ingredients_text.split("--") if item.strip()]
                elif section.startswith("directions:"):
                    directions_text = section.replace("directions:", "").strip()
                    recipe["directions"] = [step.strip().capitalize() for step in directions_text.split("--") if step.strip()]

            # Wenn der Titel fehlt, erstelle einen
            if "title" not in recipe:
                recipe["title"] = f"Rezept mit {', '.join(current_ingredients[:3])}"

            # Stelle sicher, dass alle Abschnitte existieren
            if "ingredients" not in recipe:
                recipe["ingredients"] = current_ingredients
            if "directions" not in recipe:
                recipe["directions"] = ["Keine Anweisungen generiert"]

            # Validiere das Rezept
            if validate_recipe_ingredients(recipe["ingredients"], original_ingredients):
                # print(f"Erfolg bei Versuch {attempt + 1}: Rezept hat die richtige Anzahl von Zutaten")
                return recipe
            else:
                # print(f"Versuch {attempt + 1} fehlgeschlagen: Erwartet {len(original_ingredients)} Zutaten, erhalten {len(recipe['ingredients'])}")
                if attempt == max_retries - 1:
                    # print("Maximale Wiederholungsversuche erreicht, letztes generiertes Rezept wird zurückgegeben")
                    return recipe

        except Exception as e:
            # print(f"Fehler bei der Rezeptgenerierung Versuch {attempt + 1}: {str(e)}")
            if attempt == max_retries - 1:
                return {
                    "title": f"Rezept mit {original_ingredients[0] if original_ingredients else 'Zutaten'}",
                    "ingredients": original_ingredients,
                    "directions": ["Fehler beim Generieren der Rezeptanweisungen"]
                }

    # Fallback (sollte nicht erreicht werden)
    return {
        "title": f"Rezept mit {original_ingredients[0] if original_ingredients else 'Zutaten'}",
        "ingredients": original_ingredients,
        "directions": ["Fehler beim Generieren der Rezeptanweisungen"]
    }

# Diese Funktion wird von der Gradio-UI und der FastAPI-Route aufgerufen.
# Sie ist für die Kernlogik zuständig.
def process_recipe_request_logic(required_ingredients, available_ingredients, max_ingredients, max_retries):
    """
    Kernlogik zur Verarbeitung einer Rezeptgenerierungsanfrage.
    Ausgelagert, um von verschiedenen Endpunkten aufgerufen zu werden.
    """
    if not required_ingredients and not available_ingredients:
        return {"error": "Keine Zutaten angegeben"}

    try:
        # Optimale Zutaten finden
        optimized_ingredients = find_best_ingredients(
            required_ingredients,
            available_ingredients,
            max_ingredients
        )

        # Rezept mit optimierten Zutaten generieren
        recipe = generate_recipe_with_t5(optimized_ingredients, max_retries)

        # Ergebnis formatieren
        result = {
            'title': recipe['title'],
            'ingredients': recipe['ingredients'],
            'directions': recipe['directions'],
            'used_ingredients': optimized_ingredients
        }
        return result

    except Exception as e:
        return {"error": f"Fehler bei der Rezeptgenerierung: {str(e)}"}

def flutter_api_generate_recipe(ingredients_data: str): # Typ-Hint für Klarheit
    """
    Diese Funktion wird vom 'hugging_face_chat_gradio'-Paket über die API aufgerufen.
    Sie erwartet einen JSON-STRING als Eingabe.
    """
    try:
        # Der 'hugging_face_chat_gradio'-Client sendet das Payload als String.
        data = json.loads(ingredients_data)

        required_ingredients = data.get('required_ingredients', [])
        available_ingredients = data.get('available_ingredients', [])
        max_ingredients = data.get('max_ingredients', 7)
        max_retries = data.get('max_retries', 5)

        # Rufe die Kernlogik auf
        result_dict = process_recipe_request_logic(
            required_ingredients, available_ingredients, max_ingredients, max_retries
        )
        return json.dumps(result_dict) # Gibt einen JSON-STRING zurück

    except Exception as e:
        # Logge den Fehler für Debugging im Space-Log
        print(f"Error in flutter_api_generate_recipe: {str(e)}")
        return json.dumps({"error": f"Internal API Error: {str(e)}"})

def gradio_ui_generate_recipe(required_ingredients_text, available_ingredients_text, max_ingredients_val, max_retries_val):
    """Gradio UI Funktion für die Web-Oberfläche"""
    try:
        required_ingredients = [ing.strip() for ing in required_ingredients_text.split(',') if ing.strip()]
        available_ingredients = [ing.strip() for ing in available_ingredients_text.split(',') if ing.strip()]

        # Rufe die Kernlogik auf
        result = process_recipe_request_logic(
            required_ingredients, available_ingredients, max_ingredients_val, max_retries_val
        )

        if 'error' in result:
            return result['error'], "", "", ""

        ingredients_list = '\n'.join([f"• {ing}" for ing in result['ingredients']])
        directions_list = '\n'.join([f"{i+1}. {dir}" for i, dir in enumerate(result['directions'])])
        used_ingredients = ', '.join(result['used_ingredients'])

        return (
            result['title'],
            ingredients_list,
            directions_list,
            used_ingredients
        )

    except Exception as e:
        # Fehlermeldung für die Gradio UI
        return f"Fehler: {str(e)}", "", "", ""

# Erstelle die Gradio Oberfläche
with gr.Blocks(title="AI Rezept Generator") as demo:
    gr.Markdown("# 🍳 AI Rezept Generator")
    gr.Markdown("Generiere Rezepte mit KI und intelligenter Zutat-Kombination!")

    with gr.Tab("Web-Oberfläche"):
        with gr.Row():
            with gr.Column():
                required_ing = gr.Textbox(
                    label="Benötigte Zutaten (kommasepariert)",
                    placeholder="Hähnchen, Reis, Zwiebel",
                    lines=2
                )
                available_ing = gr.Textbox(
                    label="Verfügbare Zutaten (kommasepariert, optional)",
                    placeholder="Knoblauch, Tomate, Pfeffer, Kräuter",
                    lines=2
                )
                max_ing = gr.Slider(3, 10, value=7, step=1, label="Maximale Zutaten")
                max_retries = gr.Slider(1, 10, value=5, step=1, label="Max. Wiederholungsversuche")

                generate_btn = gr.Button("Rezept generieren", variant="primary")

            with gr.Column():
                title_output = gr.Textbox(label="Rezepttitel", interactive=False)
                ingredients_output = gr.Textbox(label="Zutaten", lines=8, interactive=False)
                directions_output = gr.Textbox(label="Anweisungen", lines=10, interactive=False)
                used_ingredients_output = gr.Textbox(label="Verwendete Zutaten", interactive=False)

                generate_btn.click(
                    fn=gradio_ui_generate_recipe,
                    inputs=[required_ing, available_ing, max_ing, max_retries],
                    outputs=[title_output, ingredients_output, directions_output, used_ingredients_output]
                )

    with gr.Tab("API-Test"):
        gr.Markdown("### Teste die Flutter API (via 'hugging_face_chat_gradio' Client)")
        gr.Markdown("Dieser Tab zeigt, wie die Eingabe für die 'generate_recipe_for_flutter'-API aussehen sollte.")

        api_input = gr.Textbox(
            label="JSON-Eingabe (für API-Aufruf)",
            placeholder='{"required_ingredients": ["chicken", "rice"], "available_ingredients": ["onion", "garlic"], "max_ingredients": 6}',
            lines=4
        )
        api_output = gr.Textbox(label="JSON-Ausgabe", lines=15, interactive=False)
        api_test_btn = gr.Button("API testen", variant="secondary")

        api_test_btn.click(
            fn=flutter_api_generate_recipe,
            inputs=[api_input],
            outputs=[api_output],
            api_name="generate_recipe_for_flutter" # Dies ist der api_name, den das Flutter-Paket verwendet
        )

        gr.Examples(
            examples=[
                ['{"required_ingredients": ["chicken", "rice"], "available_ingredients": ["onion", "garlic", "tomato"], "max_ingredients": 6}'],
                ['{"ingredients": ["pasta"], "available_ingredients": ["cheese", "mushrooms", "cream"], "max_ingredients": 5}']
            ],
            inputs=[api_input]
        )

# Gradio-App starten
if __name__ == "__main__":
    demo.launch()