Spaces:

HaveAI
/

Flarechatbot

Sleeping

App Files Files Community

HaveAI commited on 24 days ago

Commit

e6a05a9

verified ·

1 Parent(s): 4d582ca

Update app.py

Browse files

Files changed (1) hide show

app.py +12 -13

app.py CHANGED Viewed

@@ -2,28 +2,27 @@ import gradio as gr
 from huggingface_hub import InferenceClient
 import os
-# 1. Инициализация клиента
 token = os.getenv("HF_TOKEN")
-# Используем модель, которая лучше всего понимает русский
-client = InferenceClient("HuggingFaceH4/zephyr-7b-beta", token=token)
 def respond(message, history):
-    # Начальный системный промпт
-    system_message = "Ты — полезный ИИ-ассистент. Отвечай на русском языке."
-    messages = [{"role": "system", "content": system_message}]
-    # Обработка истории (самый старый и надежный способ)
     for user_msg, assistant_msg in history:
-        messages.append({"role": "user", "content": user_msg})
-        messages.append({"role": "assistant", "content": assistant_msg})
-    # Добавляем текущее сообщение
     messages.append({"role": "user", "content": message})
     response = ""
     try:
-        # Генерация
         for message_chunk in client.chat_completion(
             messages=messages,
             max_tokens=1000,
@@ -35,9 +34,9 @@ def respond(message, history):
                 response += token_text
                 yield response
     except Exception as e:
-        yield f"Ошибка API: {str(e)}"
-# 2. Самый простой запуск интерфейса без лишних аргументов
 demo = gr.ChatInterface(fn=respond)
 if __name__ == "__main__":

 from huggingface_hub import InferenceClient
 import os
+# Используем максимально свежую и поддерживаемую модель
+# Llama-3.2-3B-Instruct — идеальный баланс скорости и ума
 token = os.getenv("HF_TOKEN")
+client = InferenceClient("meta-llama/Llama-3.2-3B-Instruct", token=token)
 def respond(message, history):
+    messages = [{"role": "system", "content": "Ты — полезный ИИ-ассистент. Отвечай на русском языке."}]
+    # Наполняем историю
     for user_msg, assistant_msg in history:
+        if user_msg:
+            messages.append({"role": "user", "content": user_msg})
+        if assistant_msg:
+            messages.append({"role": "assistant", "content": assistant_msg})
     messages.append({"role": "user", "content": message})
     response = ""
     try:
+        # Пытаемся получить ответ
         for message_chunk in client.chat_completion(
             messages=messages,
             max_tokens=1000,
                 response += token_text
                 yield response
     except Exception as e:
+        # Если модель всё еще капризничает, бот скажет об этом прямо в чате
+        yield f"Ошибка: {str(e)}. Попробуй подождать минуту или проверь HF_TOKEN."
 demo = gr.ChatInterface(fn=respond)
 if __name__ == "__main__":