Spaces:

HaveAI
/

Flarechatbot

Sleeping

App Files Files Community

HaveAI commited on 25 days ago

Commit

4d582ca

verified ·

1 Parent(s): 24a5120

Update app.py

Browse files

Files changed (1) hide show

app.py +17 -26

app.py CHANGED Viewed

@@ -2,31 +2,28 @@ import gradio as gr
 from huggingface_hub import InferenceClient
 import os
-# Используем токен и модель (Llama 3.2 — одна из самых стабильных сейчас)
 token = os.getenv("HF_TOKEN")
-client = InferenceClient("meta-llama/Llama-3.2-3B-Instruct", token=token)
 def respond(message, history):
     # Начальный системный промпт
-    messages = [{"role": "system", "content": "Ты — дружелюбный ИИ-помощник. Отвечай на русском языке."}]
-    # Умная обработка истории, чтобы избежать ошибки unpack
-    for entry in history:
-        if isinstance(entry, dict):
-            # Если история пришла в новом формате (словари)
-            messages.append(entry)
-        elif isinstance(entry, (list, tuple)):
-            # Если история пришла в старом формате (пары)
-            messages.append({"role": "user", "content": entry[0]})
-            messages.append({"role": "assistant", "content": entry[1]})
-    # Добавляем новое сообщение пользователя
     messages.append({"role": "user", "content": message})
     response = ""
     try:
-        # Генерация ответа
         for message_chunk in client.chat_completion(
             messages=messages,
             max_tokens=1000,
@@ -38,16 +35,10 @@ def respond(message, history):
                 response += token_text
                 yield response
     except Exception as e:
-        yield f"Произошла ошибка API: {str(e)}"
-# Создаем интерфейс.
-# В новых версиях Gradio тип 'messages' для type_history наиболее стабилен
-demo = gr.ChatInterface(
-    fn=respond,
-    type="messages",
-    title="Мой умный чат-бот",
-    textbox=gr.Textbox(placeholder="Напиши что-нибудь...", container=False, scale=7),
-)
 if __name__ == "__main__":
     demo.launch()

 from huggingface_hub import InferenceClient
 import os
+# 1. Инициализация клиента
 token = os.getenv("HF_TOKEN")
+# Используем модель, которая лучше всего понимает русский
+client = InferenceClient("HuggingFaceH4/zephyr-7b-beta", token=token)
 def respond(message, history):
     # Начальный системный промпт
+    system_message = "Ты — полезный ИИ-ассистент. Отвечай на русском языке."
+    messages = [{"role": "system", "content": system_message}]
+    # Обработка истории (самый старый и надежный способ)
+    for user_msg, assistant_msg in history:
+        messages.append({"role": "user", "content": user_msg})
+        messages.append({"role": "assistant", "content": assistant_msg})
+    # Добавляем текущее сообщение
     messages.append({"role": "user", "content": message})
     response = ""
     try:
+        # Генерация
         for message_chunk in client.chat_completion(
             messages=messages,
             max_tokens=1000,
                 response += token_text
                 yield response
     except Exception as e:
+        yield f"Ошибка API: {str(e)}"
+# 2. Самый простой запуск интерфейса без лишних аргументов
+demo = gr.ChatInterface(fn=respond)
 if __name__ == "__main__":
     demo.launch()