Spaces:

ai-tomoni
/

project-green

Runtime error

App Files Files

ai-tomoni commited on Jun 17

Commit

886ffaf

verified ·

1 Parent(s): f6ad76d

Update app.py

Browse files

Files changed (1) hide show

app.py +33 -34

app.py CHANGED Viewed

@@ -9,12 +9,9 @@ import json
 # Deutsche LLM Konfiguration
 HF_TOKEN = os.getenv("tomoniaccess")
 current_model = "HuggingFaceH4/zephyr-7b-beta"
-#client = InferenceClient(model=current_model, token=HF_TOKEN)
-client = InferenceClient(
-    model=current_model,
-    provider="auto",  # <- automatisch wählen
-    token=HF_TOKEN
-)
 conversation_history = []
@@ -35,46 +32,50 @@ def enhanced_chat_response(user_input, max_tokens, temperature, top_p):
     # Hier printen wir die messages vor dem API-Aufruf
     print("Messages sent to API:", messages)
     # Testfrage an Modell, ob es die Rolle kennt:
     test_message = {"role": "user", "content": "Was bist du für eine Rolle?"}
     messages_test = [system_prompt, test_message]
     test_response = ""
-    #for mistralai/Mistral-7B-Instruct-v0.3
-    #role_instruction = (
-    #"Du bist ein depressiver 16-jähriger Teenager. Antworte so, wie es deiner Stimmung entspricht.\n"
-    #f"User: {user_input}\nAssistant:"
-    #)
-    #messages = [{"role": "user", "content": role_instruction}]
-    for message in client.chat_completion(
-        messages=messages_test,
-        max_tokens=50,
-        stream=False,
-    ):
-        test_response += message.choices[0].message.content
-    print("Modellantwort auf Rollentest:", test_response)
     response_text = ""
     try:
-        for message in client.chat_completion(
             messages=messages,
             max_tokens=min(max_tokens, 100),
             stream=False,
             temperature=temperature,
             top_p=top_p
-        ):
-            token = message.choices[0].delta.content
-            if token:
-                response_text += token
     except Exception as e:
         print(f"API Error: {e}")
@@ -83,8 +84,7 @@ def enhanced_chat_response(user_input, max_tokens, temperature, top_p):
     print("Antwort des Modells:", response_text)
-    response_text = response_text.strip()
     chat_display = f"**Du:** {user_input}\n**Assistant:** {response_text}\n\n"
@@ -137,7 +137,6 @@ with gr.Blocks(title="Depression Training Simulator", theme=gr.themes.Soft()) as
             #    feedback_display = gr.Markdown("Starte ein Gespräch, um Feedback zu erhalten.")
     # Event Bindings
     send_btn.click(
         fn=enhanced_chat_response,
         inputs=[user_input, max_tokens, temperature, top_p],

 # Deutsche LLM Konfiguration
 HF_TOKEN = os.getenv("tomoniaccess")
 current_model = "HuggingFaceH4/zephyr-7b-beta"
+# Lösung 2: Ohne Provider Parameter (Standard HuggingFace)
+client = InferenceClient(model=current_model, token=HF_TOKEN)
 conversation_history = []
     # Hier printen wir die messages vor dem API-Aufruf
     print("Messages sent to API:", messages)
     # Testfrage an Modell, ob es die Rolle kennt:
     test_message = {"role": "user", "content": "Was bist du für eine Rolle?"}
     messages_test = [system_prompt, test_message]
     test_response = ""
+    try:
+        # Erst den Rollentest
+        test_result = client.chat_completion(
+            messages=messages_test,
+            max_tokens=50,
+            stream=False,
+        )
+        # Korrigiere den Zugriff auf die Antwort
+        if hasattr(test_result, 'choices') and test_result.choices:
+            test_response = test_result.choices[0].message.content
+        else:
+            # Fallback für andere Antwortformate
+            test_response = str(test_result)
+        print("Modellantwort auf Rollentest:", test_response)
+    except Exception as e:
+        print(f"Test API Error: {e}")
+        test_response = "Test fehlgeschlagen"
     response_text = ""
     try:
+        # Hauptanfrage - korrigiere auch hier den Zugriff
+        result = client.chat_completion(
             messages=messages,
             max_tokens=min(max_tokens, 100),
             stream=False,
             temperature=temperature,
             top_p=top_p
+        )
+        # Korrigiere den Zugriff auf die Antwort
+        if hasattr(result, 'choices') and result.choices:
+            response_text = result.choices[0].message.content
+        else:
+            # Fallback für andere Antwortformate
+            response_text = str(result)
     except Exception as e:
         print(f"API Error: {e}")
     print("Antwort des Modells:", response_text)
+    response_text = response_text.strip() if response_text else ""
     chat_display = f"**Du:** {user_input}\n**Assistant:** {response_text}\n\n"
             #    feedback_display = gr.Markdown("Starte ein Gespräch, um Feedback zu erhalten.")
     # Event Bindings
     send_btn.click(
         fn=enhanced_chat_response,
         inputs=[user_input, max_tokens, temperature, top_p],