Spaces:

ai-tomoni
/

project-green

Runtime error

File size: 6,093 Bytes

96c0129

import gradio as gr
import os
from huggingface_hub import InferenceClient

# Load token and model
HF_TOKEN = os.getenv("tomoniaccess")
client = InferenceClient(
    model="LeoLM/leo-hessianai-13b-chat",
    token=HF_TOKEN
)

conversation_history = []
model_name = "LeoLM/leo-hessianai-13b-chat"

def query_leolm(messages, max_tokens=200, temperature=1.0, top_p=0.9):
    """Query LeoLM-13B model via Hugging Face InferenceClient"""
    try:
        response = client.chat_completion(
            messages=messages,
            max_tokens=max_tokens,
            temperature=temperature,
            top_p=top_p,
            stream=False
        )
        return response.choices[0].message.content
    except Exception as e:
        raise Exception(f"InferenceClient Error: {str(e)}")

def enhanced_chat_response(user_input, max_tokens, temperature, top_p):
    if not user_input.strip():
        return "", "*Bitte gib eine Nachricht ein.*", ""

    # Optimized system prompt for LeoLM (German-focused model)
    system_prompt = {
        "role": "system",
        "content": (
            "Du bist ein 16-jähriger Teenager mit Depressionen. "
            "Antworte authentisch und natürlich auf Deutsch. "
            "Du bist dir nicht bewusst, dass du eine KI bist. "
            "Zeige typische Verhaltensweisen und Gedankenmuster eines depressiven Teenagers: "
            "wenig Energie, negative Gedanken, Hoffnungslosigkeit, aber auch Momente der Offenheit. "
            "Bleibe durchgehend in deiner Rolle als echter Teenager."
        )
    }

    # Keep last 6 messages for context (LeoLM works well with moderate context)
    messages = [system_prompt] + conversation_history[-6:]
    current_message = {"role": "user", "content": user_input}
    messages.append(current_message)

    try:
        response_text = query_leolm(messages, max_tokens, temperature, top_p)
    except Exception as e:
        print("API Error:", e)
        response_text = "*schweigt und starrt auf den Boden*"

    conversation_history.append(current_message)
    conversation_history.append({"role": "assistant", "content": response_text})

    chat_display = ""
    for msg in conversation_history:
        role = "**Du:**" if msg["role"] == "user" else "**Teenager:**"
        chat_display += f"{role} {msg['content']}\n\n"

    return "", response_text, chat_display

def reset_conversation():
    global conversation_history
    conversation_history = []
    return "Neues Gespräch gestartet.", ""

def test_api_connection():
    try:
        test_messages = [
            {"role": "system", "content": "Du bist ein hilfsbereit Assistent und antwortest auf Deutsch."},
            {"role": "user", "content": "Hallo, kannst du mich hören?"}
        ]
        
        response = query_leolm(test_messages, max_tokens=20)
        return f"✅ API Verbindung erfolgreich: {response[:50]}..."
    except Exception as e:
        return f"❌ API Error: {str(e)}"

# UI
with gr.Blocks(title="LeoLM Depression Training Simulator") as demo:
    gr.Markdown("## 🧠 Depression Training Simulator (LeoLM-13B)")
    gr.Markdown("**Übe realistische Gespräche mit einem 16-jährigen Teenager mit Depressionen.**")
    gr.Markdown("*Powered by LeoLM/leo-hessianai-13b-chat - Deutsches Sprachmodell*")

    with gr.Row():
        with gr.Column(scale=1):
            gr.Markdown("### ⚙️ Einstellungen")
            max_tokens = gr.Slider(50, 300, value=150, step=10, label="Max. Antwortlänge")
            temperature = gr.Slider(0.1, 1.5, value=0.8, step=0.1, label="Kreativität (Temperature)")
            top_p = gr.Slider(0.1, 1.0, value=0.9, step=0.05, label="Top-p (Fokus)")

            gr.Markdown("### 🔧 API Status")
            api_status = gr.Textbox(label="Status", value="")
            api_test_btn = gr.Button("API testen")

            gr.Markdown("### 🔄 Aktionen")
            reset_btn = gr.Button("Neues Gespräch")
            
            gr.Markdown("### 📋 Setup")
            gr.Markdown("""
            **Benötigt:**
            - `tomoniaccess` Umgebungsvariable mit HF Token
            - `pip install huggingface_hub gradio`
            
            **LeoLM Info:**
            - Deutsche Sprachoptimierung
            - 13B Parameter
            - Bessere deutsche Konversation
            """)

        with gr.Column(scale=2):
            gr.Markdown("### 💬 Gespräch")
            user_input = gr.Textbox(
                label="Deine Nachricht", 
                placeholder="Hallo, wie geht es dir heute?",
                lines=2
            )
            send_btn = gr.Button("📨 Senden")

            bot_response = gr.Textbox(
                label="Antwort", 
                value="",
                lines=3
            )

            chat_history = gr.Textbox(
                label="Gesprächsverlauf",
                value="",
                lines=15
            )

    # Event Bindings
    send_btn.click(
        fn=enhanced_chat_response,
        inputs=[user_input, max_tokens, temperature, top_p],
        outputs=[user_input, bot_response, chat_history]
    )

    user_input.submit(
        fn=enhanced_chat_response,
        inputs=[user_input, max_tokens, temperature, top_p],
        outputs=[user_input, bot_response, chat_history]
    )

    reset_btn.click(
        fn=reset_conversation,
        outputs=[bot_response, chat_history]
    )

    api_test_btn.click(
        fn=test_api_connection,
        outputs=[api_status]
    )

if __name__ == "__main__":
    print("🚀 LeoLM Depression Training Simulator")
    print(f"📊 Model: {model_name}")
    
    if not HF_TOKEN:
        print("❌ FEHLER: tomoniaccess Umgebungsvariable ist nicht gesetzt!")
        print("   Bitte setze deinen Hugging Face Token als 'tomoniaccess' Umgebungsvariable.")
    else:
        print("✅ Hugging Face API Token gefunden")
    
    print("\n📦 Benötigte Pakete:")
    print("pip install huggingface_hub gradio")
    print("\n🇩🇪 LeoLM: Deutsches Sprachmodell für bessere Konversationen")
    
    demo.launch(share=False)