Spaces:

HaveAI
/

Flarechatbot

Sleeping

App Files Files Community

HaveAI commited on Feb 25

Commit

57fe6ea

verified ·

1 Parent(s): bc379c4

Update app.py

Browse files

Files changed (1) hide show

app.py +28 -16

app.py CHANGED Viewed

@@ -2,48 +2,60 @@ import gradio as gr
 from huggingface_hub import InferenceClient
 import os
-# Используем модель Qwen — она сейчас работает стабильнее всех с русским языком
 token = os.getenv("HF_TOKEN")
 client = InferenceClient("Qwen/Qwen2.5-72B-Instruct", token=token)
 def respond(message, history):
-    # Ограничиваем историю последними 5 сообщениями, чтобы не перегружать API
-    history = history[-5:]
-    messages = [{"role": "system", "content": "Ты — профессиональный ИИ-ассистент твоё имя Flare. Пиши грамотно на русском языке."}]
     for user_msg, assistant_msg in history:
         if user_msg:
             messages.append({"role": "user", "content": user_msg})
         if assistant_msg:
             messages.append({"role": "assistant", "content": assistant_msg})
     messages.append({"role": "user", "content": message})
     response = ""
     try:
-        # Уменьшаем max_tokens для стабильности
         for message_chunk in client.chat_completion(
             messages=messages,
-            max_tokens=512,
             stream=True,
-            temperature=0.5, # Снизили температуру для точности
         ):
-            token_text = message_chunk.choices[0].delta.content
-            if token_text:
                 response += token_text
                 yield response
     except Exception as e:
-        if "rate limit" in str(e).lower():
-            yield "Ошибка: Слишком много запросов. Подожди 15 секунд."
-        else:
-            yield f"Ошибка API: {str(e)}"
-# Настройка интерфейса без лишних аргументов
 demo = gr.ChatInterface(
     fn=respond,
-    examples=["Как дела?", "Напиши план тренировки", "Что такое ИИ?"],
-    title="Стабильный ИИ Чат"
 )
 if __name__ == "__main__":

 from huggingface_hub import InferenceClient
 import os
+# Инициализация клиента.
+# Используем Qwen 2.5 72B — она сейчас лучшая для русского языка в бесплатном API
 token = os.getenv("HF_TOKEN")
 client = InferenceClient("Qwen/Qwen2.5-72B-Instruct", token=token)
 def respond(message, history):
+    # Ограничиваем контекст (последние 7 сообщений), чтобы не перегружать память
+    history = history[-7:]
+    # Твой системный промпт с именем Flare
+    messages = [
+        {"role": "system", "content": "Ты — профессиональный ИИ-ассистент. Твоё имя Flare. Пиши грамотно и вежливо на русском языке."}
+    ]
+    # Собираем историю диалога
     for user_msg, assistant_msg in history:
         if user_msg:
             messages.append({"role": "user", "content": user_msg})
         if assistant_msg:
             messages.append({"role": "assistant", "content": assistant_msg})
+    # Добавляем новое сообщение
     messages.append({"role": "user", "content": message})
     response = ""
     try:
+        # Запрос к модели
         for message_chunk in client.chat_completion(
             messages=messages,
+            max_tokens=1024,
             stream=True,
+            temperature=0.6,
         ):
+            # Безопасная проверка: есть ли данные в ответе?
+            if (hasattr(message_chunk, 'choices') and
+                message_chunk.choices and
+                message_chunk.choices[0].delta.content is not None):
+                token_text = message_chunk.choices[0].delta.content
                 response += token_text
                 yield response
     except Exception as e:
+        # Если API выдаст ошибку, пользователь увидит её в чате, а не белый экран
+        yield f"Ошибка связи с Flare: {str(e)}"
+# Настройка интерфейса Gradio
 demo = gr.ChatInterface(
     fn=respond,
+    title="Flare AI Assistant",
+    description="Ваш персональный помощник в Hugging Face Spaces",
+    examples=["Привет! Как тебя зовут?", "Flare, напиши план на день", "Объясни квантовую физику просто"],
+    cache_examples=False # Отключаем кэш, чтобы избежать лишних ошибок при сборке
 )
 if __name__ == "__main__":