Spaces:

HaveAI
/

Flarechatbot

Sleeping

App Files Files Community

HaveAI commited on 22 days ago

Commit

d646eab

verified ·

1 Parent(s): 57fe6ea

Update app.py

Browse files

Files changed (1) hide show

app.py +23 -37

app.py CHANGED Viewed

@@ -2,60 +2,46 @@ import gradio as gr
 from huggingface_hub import InferenceClient
 import os
-# Инициализация клиента.
-# Используем Qwen 2.5 72B — она сейчас лучшая для русского языка в бесплатном API
 token = os.getenv("HF_TOKEN")
-client = InferenceClient("Qwen/Qwen2.5-72B-Instruct", token=token)
 def respond(message, history):
-    # Ограничиваем контекст (последние 7 сообщений), чтобы не перегружать память
-    history = history[-7:]
-    # Твой системный промпт с именем Flare
-    messages = [
-        {"role": "system", "content": "Ты — профессиональный ИИ-ассистент. Твоё имя Flare. Пиши грамотно и вежливо на русском языке."}
-    ]
-    # Собираем историю диалога
-    for user_msg, assistant_msg in history:
-        if user_msg:
-            messages.append({"role": "user", "content": user_msg})
-        if assistant_msg:
-            messages.append({"role": "assistant", "content": assistant_msg})
-    # Добавляем новое сообщение
-    messages.append({"role": "user", "content": message})
     response = ""
     try:
-        # Запрос к модели
         for message_chunk in client.chat_completion(
             messages=messages,
-            max_tokens=1024,
             stream=True,
-            temperature=0.6,
         ):
-            # Безопасная проверка: есть ли данные в ответе?
-            if (hasattr(message_chunk, 'choices') and
-                message_chunk.choices and
-                message_chunk.choices[0].delta.content is not None):
                 token_text = message_chunk.choices[0].delta.content
-                response += token_text
-                yield response
     except Exception as e:
-        # Если API выдаст ошибку, пользователь увидит её в чате, а не белый экран
-        yield f"Ошибка связи с Flare: {str(e)}"
-# Настройка интерфейса Gradio
 demo = gr.ChatInterface(
     fn=respond,
-    title="Flare AI Assistant",
-    description="Ваш персональный помощник в Hugging Face Spaces",
-    examples=["Привет! Как тебя зовут?", "Flare, напиши план на день", "Объясни квантовую физику просто"],
-    cache_examples=False # Отключаем кэш, чтобы избежать лишних ошибок при сборке
 )
 if __name__ == "__main__":

 from huggingface_hub import InferenceClient
 import os
+# Используем Llama 3.2 3B - она ЛУЧШАЯ по стабильности для бесплатных Space
 token = os.getenv("HF_TOKEN")
+client = InferenceClient("meta-llama/Llama-3.2-3B-Instruct", token=token)
 def respond(message, history):
+    # Системная инструкция
+    messages = [{"role": "system", "content": "Ты — профессиональный ИИ-ассистент Flare. Пиши грамотно на русском языке."}]
+    # Добавляем только последние 3 сообщения, чтобы точно не вылетала ошибка лимита
+    for user_msg, assistant_msg in history[-3:]:
+        if user_msg and assistant_msg:
+            messages.append({"role": "user", "content": str(user_msg)})
+            messages.append({"role": "assistant", "content": str(assistant_msg)})
+    # Текущее сообщение
+    messages.append({"role": "user", "content": str(message)})
     response = ""
     try:
+        # Уменьшаем число токенов в ответе для скорости
         for message_chunk in client.chat_completion(
             messages=messages,
+            max_tokens=500,
             stream=True,
+            temperature=0.7,
         ):
+            if message_chunk.choices and len(message_chunk.choices) > 0:
                 token_text = message_chunk.choices[0].delta.content
+                if token_text:
+                    response += token_text
+                    yield response
     except Exception as e:
+        # Если всё же упало, выводим причину
+        yield f"Flare столкнулся с ошибкой. Попробуй еще раз через 5 секунд. (Текст ошибки: {str(e)})"
+# Создаем интерфейс без лишних наворотов
 demo = gr.ChatInterface(
     fn=respond,
+    title="Flare AI",
+    description="Стабильная версия ассистента"
 )
 if __name__ == "__main__":