Spaces:

CoCoGames
/

CocoAi-Test

Runtime error

File size: 6,623 Bytes

f4830bf
10d3da5
f4830bf
 
10d3da5
f4830bf
10d3da5
f4830bf
555d322
10d3da5
 
 
 
f4830bf
10d3da5
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
f4830bf
 
10d3da5
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
fceae9a
f4830bf
fceae9a
 
 
 
 
 
 
 
 
 
10d3da5
f4830bf
10d3da5
 
 
fceae9a
10d3da5
fceae9a
 
10d3da5
 
f4830bf
fceae9a
 
f4830bf
10d3da5
f4830bf
 
fceae9a
10d3da5
 
 
f4830bf
10d3da5
f4830bf
10d3da5
f4830bf
10d3da5
 
 
 
 
 
 
 
 
 
 
 
 
f4830bf
10d3da5
 
 
 
 
 
 
 
 
 
 
 
f4830bf
 
10d3da5
f4830bf
 
 
10d3da5
 
f4830bf
 
 
 
 
10d3da5
f4830bf
 
 
 
10d3da5
 
f4830bf

import gradio as gr
import torch
from transformers import AutoTokenizer, AutoModelForCausalLM, pipeline
import re
import os

# --- 1. KONFIGURATION ---
# Ersetzen Sie dies durch den tatsächlichen Pfad oder Namen Ihres Modells auf Hugging Face
MODEL_NAME = "CocoEntertainment/CocoAi-1PTE" 

# Setzt den Datentyp auf float16 (halbe Präzision), um den Speicherbedarf beim Laden zu minimieren.
DTYPE = torch.float16

DESCRIPTION_TEXT = """
# 🤖 Willkommen bei CocoAi

## Ein Chatbot von CocoEntertainment

Hier kannst du auf Deutsch mit **CocoAi** chatten.

CocoAi ist ein **Mistral 7B** Modell, das spezifisch für Unterhaltung und kreative Inhalte feingetuned und quantisiert wurde, um eine effiziente Nutzung zu ermöglichen.

### 💡 CocoAi Markdown Syntax (wie die Antworten formatiert werden)
Das Modell antwortet unter Verwendung der folgenden speziellen Formatierungsregeln. Das Interface konvertiert diese in Standard-Markdown zur Anzeige:

* **\*Text example\*** = Fett (**Bold**)
* **\*\*Text example\*\* ** = Kursiv (*Italic*)
* **\*\*\*Text example\*\*\* ** = Fett und Kursiv (***Bold and Italic***)
* **#Text example** = Haupttitel (Sehr groß)
* **/n** = Zeilenumbruch
* **'Text example'** = Inline-Text/Code (Monospace)
* **'''Text example'''** = Code-Block (Block Monospace)

"""

# --- 2. HILFSFUNKTION ZUR ANPASSUNG DER SYNTAX ---
def convert_to_gradio_markdown(text):
    """Konvertiert die CocoAi-Markdown-Syntax in Gradio-kompatibles Standard-Markdown."""
    
    # 1. Code-Block ('''Text example''' -> ```Text example```)
    # Re.DOTALL erlaubt es, über Zeilenumbrüche hinweg zu matchen
    text = re.sub(r"'''(.*?)'''", r"```\1```", text, flags=re.DOTALL) 
    
    # 2. Inline Text ('Text example' -> `Text example`)
    text = re.sub(r"'(.*?)'", r"`\1`", text) 

    # 3. Fett und Kursiv (***Text example*** -> ***Text example***)
    # Standard-Markdown wird hier beibehalten.
    
    # 4. Kursiv (**Text example** -> *Text example*)
    # Wenn **Ihr** Modell **kursiv** mit **zwei** Sternen markiert (Abweichung vom Standard).
    # Hier nehmen wir an, dass Sie die Standard-Logik von *fett* (CocoAi:*) und *kursiv* (CocoAi:**) invertieren wollen.
    text = re.sub(r"\*\*(.*?)\*\*", r"*\1*", text)
    
    # 5. Fett (*Text example* -> **Text example**)
    # Wenn **Ihr** Modell **fett** mit **einem** Stern markiert.
    text = re.sub(r"\*(.*?)\*", r"**\1**", text)

    # 6. Zeilenumbruch (/n -> \n)
    text = text.replace("/n", "\n")
    
    return text

# --- 3. MODELL LADEN (MAXIMALE SPEICHEROPTIMIERUNG) ---
try:
    print(f"--- Starte Ladevorgang für {MODEL_NAME} mit maximaler Optimierung ---")
    
    # Konfiguration für 4-Bit Quantisierung
    bnb_config = BitsAndBytesConfig(
        load_in_4bit=True,
        bnb_4bit_quant_type="nf4",
        # Auf CPU ignorieren diese Parameter oft, aber sie helfen, 
        # das Laden explizit in den minimalen Speicherzustand zu versetzen
        bnb_4bit_compute_dtype=DTYPE 
    )
    
    tokenizer = AutoTokenizer.from_pretrained(MODEL_NAME)
    
    model = AutoModelForCausalLM.from_pretrained(
        MODEL_NAME,
        quantization_config=bnb_config,  # Versucht, es als 4-Bit zu laden
        device_map="auto",
        # Fügen Sie 'low_cpu_mem_usage=True' hinzu, um den CPU-Speicherverbrauch zu optimieren
        low_cpu_mem_usage=True, 
        trust_remote_code=True, 
    )
    
    # Erstellt die Pipeline... (Rest des Codes wie gehabt)
    # ...
    
    print(f"Modell '{MODEL_NAME}' erfolgreich geladen und Pipeline erstellt.")

except Exception as e:
    # ... (Rest des except-Blocks wie gehabt)
    print(f"FATALER FEHLER beim Laden des Modells {MODEL_NAME}: {e}")
    print("--- Verwende GPT-2 als langsamen Platzhalter ---")
    coco_pipe = pipeline("text-generation", model="gpt2")

# --- 4. CHAT-LOGIK ---
def generate_response(message, chat_history):
    """Generiert die Antwort des Chatbots."""
    
    # Hier müssten Sie das Prompt-Template Ihres Mistral-Modells anwenden (z.B. ChatML, Alpaca, etc.)
    # Dies ist ein generisches Beispiel:
    prompt = f"### Instruction: Beantworte die folgende Frage als CocoAi und verwende die CocoAi Markdown Syntax. ###\n\nUser: {message}\n\nCocoAi:"

    try:
        # Generierung mit der Pipeline
        model_output = coco_pipe(
            prompt, 
            num_return_sequences=1, 
            do_sample=True,
            temperature=0.7,
            top_p=0.9
        )
        
        # Extrahieren des Texts und Entfernen des Prompts
        raw_response = model_output[0]['generated_text']
        
        # WICHTIG: Nur der Teil nach "CocoAi:" ist die eigentliche Antwort
        if "CocoAi:" in raw_response:
            raw_response = raw_response.split("CocoAi:", 1)[-1].strip()
        
    except Exception as e:
        raw_response = f"Entschuldigung, beim Generieren der Antwort ist ein technischer Fehler aufgetreten: /n'Fehler: {e}'"


    # 2. Konvertiere die rohe Antwort in Gradio-kompatibles Markdown
    formatted_response = convert_to_gradio_markdown(raw_response)

    # 3. Füge die Nachricht zur Historie hinzu
    chat_history.append((message, formatted_response))
    return chat_history, ""

# --- 5. GRADIO OBERFLÄCHE ---

# Der Tab für die Beschreibung
description_tab = gr.Markdown(DESCRIPTION_TEXT)

# Der Tab für den Chat
with gr.Blocks() as chat_tab:
    gr.Markdown(f"# 💬 Chat mit CocoAi ({MODEL_NAME})")
    
    chatbot = gr.Chatbot(
        label="CocoAi Chat",
        height=500,
        # Wenn Sie die Syntax-Regeln im Chat sehen wollen, lassen Sie die Markdown-Verarbeitung zu:
        render_markdown=True 
    )
    
    msg = gr.Textbox(
        show_label=False, 
        placeholder="Geben Sie Ihre Nachricht hier ein...", 
        lines=1
    )
    
    with gr.Row():
        submit_btn = gr.Button("Senden", variant="primary", scale=2)
        clear_btn = gr.Button("Chat leeren", scale=1)

    # Ereignis-Handler für das Senden (durch Klicken oder Enter)
    submit_btn.click(
        fn=generate_response, 
        inputs=[msg, chatbot], 
        outputs=[chatbot, msg],
        queue=False
    )
    msg.submit(
        fn=generate_response, 
        inputs=[msg, chatbot], 
        outputs=[chatbot, msg],
        queue=False
    )

    # Ereignis-Handler für das Löschen
    clear_btn.click(
        fn=lambda: ([], ""), 
        inputs=None, 
        outputs=[chatbot, msg], 
        queue=False
    )

# Definiere das Tabbed Interface
iface = gr.TabbedInterface(
    [chat_tab, description_tab], 
    ["CocoAi Chat", "Beschreibung & Syntax"]
)

# Starte die App
iface.launch()