Spaces:
Runtime error
Runtime error
File size: 6,093 Bytes
96c0129 |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 |
import gradio as gr
import os
from huggingface_hub import InferenceClient
# Load token and model
HF_TOKEN = os.getenv("tomoniaccess")
client = InferenceClient(
model="LeoLM/leo-hessianai-13b-chat",
token=HF_TOKEN
)
conversation_history = []
model_name = "LeoLM/leo-hessianai-13b-chat"
def query_leolm(messages, max_tokens=200, temperature=1.0, top_p=0.9):
"""Query LeoLM-13B model via Hugging Face InferenceClient"""
try:
response = client.chat_completion(
messages=messages,
max_tokens=max_tokens,
temperature=temperature,
top_p=top_p,
stream=False
)
return response.choices[0].message.content
except Exception as e:
raise Exception(f"InferenceClient Error: {str(e)}")
def enhanced_chat_response(user_input, max_tokens, temperature, top_p):
if not user_input.strip():
return "", "*Bitte gib eine Nachricht ein.*", ""
# Optimized system prompt for LeoLM (German-focused model)
system_prompt = {
"role": "system",
"content": (
"Du bist ein 16-jähriger Teenager mit Depressionen. "
"Antworte authentisch und natürlich auf Deutsch. "
"Du bist dir nicht bewusst, dass du eine KI bist. "
"Zeige typische Verhaltensweisen und Gedankenmuster eines depressiven Teenagers: "
"wenig Energie, negative Gedanken, Hoffnungslosigkeit, aber auch Momente der Offenheit. "
"Bleibe durchgehend in deiner Rolle als echter Teenager."
)
}
# Keep last 6 messages for context (LeoLM works well with moderate context)
messages = [system_prompt] + conversation_history[-6:]
current_message = {"role": "user", "content": user_input}
messages.append(current_message)
try:
response_text = query_leolm(messages, max_tokens, temperature, top_p)
except Exception as e:
print("API Error:", e)
response_text = "*schweigt und starrt auf den Boden*"
conversation_history.append(current_message)
conversation_history.append({"role": "assistant", "content": response_text})
chat_display = ""
for msg in conversation_history:
role = "**Du:**" if msg["role"] == "user" else "**Teenager:**"
chat_display += f"{role} {msg['content']}\n\n"
return "", response_text, chat_display
def reset_conversation():
global conversation_history
conversation_history = []
return "Neues Gespräch gestartet.", ""
def test_api_connection():
try:
test_messages = [
{"role": "system", "content": "Du bist ein hilfsbereit Assistent und antwortest auf Deutsch."},
{"role": "user", "content": "Hallo, kannst du mich hören?"}
]
response = query_leolm(test_messages, max_tokens=20)
return f"✅ API Verbindung erfolgreich: {response[:50]}..."
except Exception as e:
return f"❌ API Error: {str(e)}"
# UI
with gr.Blocks(title="LeoLM Depression Training Simulator") as demo:
gr.Markdown("## 🧠 Depression Training Simulator (LeoLM-13B)")
gr.Markdown("**Übe realistische Gespräche mit einem 16-jährigen Teenager mit Depressionen.**")
gr.Markdown("*Powered by LeoLM/leo-hessianai-13b-chat - Deutsches Sprachmodell*")
with gr.Row():
with gr.Column(scale=1):
gr.Markdown("### ⚙️ Einstellungen")
max_tokens = gr.Slider(50, 300, value=150, step=10, label="Max. Antwortlänge")
temperature = gr.Slider(0.1, 1.5, value=0.8, step=0.1, label="Kreativität (Temperature)")
top_p = gr.Slider(0.1, 1.0, value=0.9, step=0.05, label="Top-p (Fokus)")
gr.Markdown("### 🔧 API Status")
api_status = gr.Textbox(label="Status", value="")
api_test_btn = gr.Button("API testen")
gr.Markdown("### 🔄 Aktionen")
reset_btn = gr.Button("Neues Gespräch")
gr.Markdown("### 📋 Setup")
gr.Markdown("""
**Benötigt:**
- `tomoniaccess` Umgebungsvariable mit HF Token
- `pip install huggingface_hub gradio`
**LeoLM Info:**
- Deutsche Sprachoptimierung
- 13B Parameter
- Bessere deutsche Konversation
""")
with gr.Column(scale=2):
gr.Markdown("### 💬 Gespräch")
user_input = gr.Textbox(
label="Deine Nachricht",
placeholder="Hallo, wie geht es dir heute?",
lines=2
)
send_btn = gr.Button("📨 Senden")
bot_response = gr.Textbox(
label="Antwort",
value="",
lines=3
)
chat_history = gr.Textbox(
label="Gesprächsverlauf",
value="",
lines=15
)
# Event Bindings
send_btn.click(
fn=enhanced_chat_response,
inputs=[user_input, max_tokens, temperature, top_p],
outputs=[user_input, bot_response, chat_history]
)
user_input.submit(
fn=enhanced_chat_response,
inputs=[user_input, max_tokens, temperature, top_p],
outputs=[user_input, bot_response, chat_history]
)
reset_btn.click(
fn=reset_conversation,
outputs=[bot_response, chat_history]
)
api_test_btn.click(
fn=test_api_connection,
outputs=[api_status]
)
if __name__ == "__main__":
print("🚀 LeoLM Depression Training Simulator")
print(f"📊 Model: {model_name}")
if not HF_TOKEN:
print("❌ FEHLER: tomoniaccess Umgebungsvariable ist nicht gesetzt!")
print(" Bitte setze deinen Hugging Face Token als 'tomoniaccess' Umgebungsvariable.")
else:
print("✅ Hugging Face API Token gefunden")
print("\n📦 Benötigte Pakete:")
print("pip install huggingface_hub gradio")
print("\n🇩🇪 LeoLM: Deutsches Sprachmodell für bessere Konversationen")
demo.launch(share=False) |