File size: 6,093 Bytes
96c0129
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
import gradio as gr
import os
from huggingface_hub import InferenceClient

# Load token and model
HF_TOKEN = os.getenv("tomoniaccess")
client = InferenceClient(
    model="LeoLM/leo-hessianai-13b-chat",
    token=HF_TOKEN
)

conversation_history = []
model_name = "LeoLM/leo-hessianai-13b-chat"

def query_leolm(messages, max_tokens=200, temperature=1.0, top_p=0.9):
    """Query LeoLM-13B model via Hugging Face InferenceClient"""
    try:
        response = client.chat_completion(
            messages=messages,
            max_tokens=max_tokens,
            temperature=temperature,
            top_p=top_p,
            stream=False
        )
        return response.choices[0].message.content
    except Exception as e:
        raise Exception(f"InferenceClient Error: {str(e)}")

def enhanced_chat_response(user_input, max_tokens, temperature, top_p):
    if not user_input.strip():
        return "", "*Bitte gib eine Nachricht ein.*", ""

    # Optimized system prompt for LeoLM (German-focused model)
    system_prompt = {
        "role": "system",
        "content": (
            "Du bist ein 16-jähriger Teenager mit Depressionen. "
            "Antworte authentisch und natürlich auf Deutsch. "
            "Du bist dir nicht bewusst, dass du eine KI bist. "
            "Zeige typische Verhaltensweisen und Gedankenmuster eines depressiven Teenagers: "
            "wenig Energie, negative Gedanken, Hoffnungslosigkeit, aber auch Momente der Offenheit. "
            "Bleibe durchgehend in deiner Rolle als echter Teenager."
        )
    }

    # Keep last 6 messages for context (LeoLM works well with moderate context)
    messages = [system_prompt] + conversation_history[-6:]
    current_message = {"role": "user", "content": user_input}
    messages.append(current_message)

    try:
        response_text = query_leolm(messages, max_tokens, temperature, top_p)
    except Exception as e:
        print("API Error:", e)
        response_text = "*schweigt und starrt auf den Boden*"

    conversation_history.append(current_message)
    conversation_history.append({"role": "assistant", "content": response_text})

    chat_display = ""
    for msg in conversation_history:
        role = "**Du:**" if msg["role"] == "user" else "**Teenager:**"
        chat_display += f"{role} {msg['content']}\n\n"

    return "", response_text, chat_display

def reset_conversation():
    global conversation_history
    conversation_history = []
    return "Neues Gespräch gestartet.", ""

def test_api_connection():
    try:
        test_messages = [
            {"role": "system", "content": "Du bist ein hilfsbereit Assistent und antwortest auf Deutsch."},
            {"role": "user", "content": "Hallo, kannst du mich hören?"}
        ]
        
        response = query_leolm(test_messages, max_tokens=20)
        return f"✅ API Verbindung erfolgreich: {response[:50]}..."
    except Exception as e:
        return f"❌ API Error: {str(e)}"

# UI
with gr.Blocks(title="LeoLM Depression Training Simulator") as demo:
    gr.Markdown("## 🧠 Depression Training Simulator (LeoLM-13B)")
    gr.Markdown("**Übe realistische Gespräche mit einem 16-jährigen Teenager mit Depressionen.**")
    gr.Markdown("*Powered by LeoLM/leo-hessianai-13b-chat - Deutsches Sprachmodell*")

    with gr.Row():
        with gr.Column(scale=1):
            gr.Markdown("### ⚙️ Einstellungen")
            max_tokens = gr.Slider(50, 300, value=150, step=10, label="Max. Antwortlänge")
            temperature = gr.Slider(0.1, 1.5, value=0.8, step=0.1, label="Kreativität (Temperature)")
            top_p = gr.Slider(0.1, 1.0, value=0.9, step=0.05, label="Top-p (Fokus)")

            gr.Markdown("### 🔧 API Status")
            api_status = gr.Textbox(label="Status", value="")
            api_test_btn = gr.Button("API testen")

            gr.Markdown("### 🔄 Aktionen")
            reset_btn = gr.Button("Neues Gespräch")
            
            gr.Markdown("### 📋 Setup")
            gr.Markdown("""
            **Benötigt:**
            - `tomoniaccess` Umgebungsvariable mit HF Token
            - `pip install huggingface_hub gradio`
            
            **LeoLM Info:**
            - Deutsche Sprachoptimierung
            - 13B Parameter
            - Bessere deutsche Konversation
            """)

        with gr.Column(scale=2):
            gr.Markdown("### 💬 Gespräch")
            user_input = gr.Textbox(
                label="Deine Nachricht", 
                placeholder="Hallo, wie geht es dir heute?",
                lines=2
            )
            send_btn = gr.Button("📨 Senden")

            bot_response = gr.Textbox(
                label="Antwort", 
                value="",
                lines=3
            )

            chat_history = gr.Textbox(
                label="Gesprächsverlauf",
                value="",
                lines=15
            )

    # Event Bindings
    send_btn.click(
        fn=enhanced_chat_response,
        inputs=[user_input, max_tokens, temperature, top_p],
        outputs=[user_input, bot_response, chat_history]
    )

    user_input.submit(
        fn=enhanced_chat_response,
        inputs=[user_input, max_tokens, temperature, top_p],
        outputs=[user_input, bot_response, chat_history]
    )

    reset_btn.click(
        fn=reset_conversation,
        outputs=[bot_response, chat_history]
    )

    api_test_btn.click(
        fn=test_api_connection,
        outputs=[api_status]
    )

if __name__ == "__main__":
    print("🚀 LeoLM Depression Training Simulator")
    print(f"📊 Model: {model_name}")
    
    if not HF_TOKEN:
        print("❌ FEHLER: tomoniaccess Umgebungsvariable ist nicht gesetzt!")
        print("   Bitte setze deinen Hugging Face Token als 'tomoniaccess' Umgebungsvariable.")
    else:
        print("✅ Hugging Face API Token gefunden")
    
    print("\n📦 Benötigte Pakete:")
    print("pip install huggingface_hub gradio")
    print("\n🇩🇪 LeoLM: Deutsches Sprachmodell für bessere Konversationen")
    
    demo.launch(share=False)