Spaces:

HaveAI
/

Flarechatbot

Sleeping

App Files Files Community

HaveAI commited on 23 days ago

Commit

bc379c4

verified ·

1 Parent(s): 160c993

Update app.py

Browse files

Files changed (1) hide show

app.py +20 -13

app.py CHANGED Viewed

@@ -2,15 +2,16 @@ import gradio as gr
 from huggingface_hub import InferenceClient
 import os
-# Используем максимально свежую и поддерживаемую модель
-# Llama-3.2-3B-Instruct — идеальный баланс скорости и ума
 token = os.getenv("HF_TOKEN")
-client = InferenceClient("meta-llama/Llama-3.2-3B-Instruct", token=token)
 def respond(message, history):
-    messages = [{"role": "system", "content": "Ты — полезный ИИ ассистент и тебя зовут Flare. Отвечай на русском языке."}]
-    # Наполняем историю
     for user_msg, assistant_msg in history:
         if user_msg:
             messages.append({"role": "user", "content": user_msg})
@@ -20,24 +21,30 @@ def respond(message, history):
     messages.append({"role": "user", "content": message})
     response = ""
     try:
-        # Пытаемся получить ответ
         for message_chunk in client.chat_completion(
             messages=messages,
-            max_tokens=1000,
             stream=True,
-            temperature=0.3,
         ):
             token_text = message_chunk.choices[0].delta.content
             if token_text:
                 response += token_text
                 yield response
     except Exception as e:
-        # Если модель всё еще капризничает, бот скажет об этом прямо в чате
-        yield f"Ошибка: {str(e)}. Попробуй подождать минуту или проверь HF_TOKEN."
-demo = gr.ChatInterface(fn=respond)
 if __name__ == "__main__":
     demo.launch()

 from huggingface_hub import InferenceClient
 import os
+# Используем модель Qwen — она сейчас работает стабильнее всех с русским языком
 token = os.getenv("HF_TOKEN")
+client = InferenceClient("Qwen/Qwen2.5-72B-Instruct", token=token)
 def respond(message, history):
+    # Ограничиваем историю последними 5 сообщениями, чтобы не перегружать API
+    history = history[-5:]
+    messages = [{"role": "system", "content": "Ты — профессиональный ИИ-ассистент твоё имя Flare. Пиши грамотно на русском языке."}]
     for user_msg, assistant_msg in history:
         if user_msg:
             messages.append({"role": "user", "content": user_msg})
     messages.append({"role": "user", "content": message})
     response = ""
     try:
+        # Уменьшаем max_tokens для стабильности
         for message_chunk in client.chat_completion(
             messages=messages,
+            max_tokens=512,
             stream=True,
+            temperature=0.5, # Снизили температуру для точности
         ):
             token_text = message_chunk.choices[0].delta.content
             if token_text:
                 response += token_text
                 yield response
     except Exception as e:
+        if "rate limit" in str(e).lower():
+            yield "Ошибка: Слишком много запросов. Подожди 15 секунд."
+        else:
+            yield f"Ошибка API: {str(e)}"
+# Настройка интерфейса без лишних аргументов
+demo = gr.ChatInterface(
+    fn=respond,
+    examples=["Как дела?", "Напиши план тренировки", "Что такое ИИ?"],
+    title="Стабильный ИИ Чат"
+)
 if __name__ == "__main__":
     demo.launch()