Spaces:

HaveAI
/

Flarechatbot

Sleeping

App Files Files Community

HaveAI commited on 20 days ago

Commit

c4a849b

verified ·

1 Parent(s): d646eab

Update app.py

Browse files

Files changed (1) hide show

app.py +43 -30

app.py CHANGED Viewed

@@ -2,47 +2,60 @@ import gradio as gr
 from huggingface_hub import InferenceClient
 import os
-# Используем Llama 3.2 3B - она ЛУЧШАЯ по стабильности для бесплатных Space
 token = os.getenv("HF_TOKEN")
 client = InferenceClient("meta-llama/Llama-3.2-3B-Instruct", token=token)
-def respond(message, history):
-    # Системная инструкция
-    messages = [{"role": "system", "content": "Ты — профессиональный ИИ-ассистент Flare. Пиши грамотно на русском языке."}]
-    # Добавляем только последние 3 сообщения, чтобы точно не вылетала ошибка лимита
-    for user_msg, assistant_msg in history[-3:]:
-        if user_msg and assistant_msg:
-            messages.append({"role": "user", "content": str(user_msg)})
-            messages.append({"role": "assistant", "content": str(assistant_msg)})
-    # Текущее сообщение
-    messages.append({"role": "user", "content": str(message)})
     response = ""
     try:
-        # Уменьшаем число токенов в ответе для скорости
-        for message_chunk in client.chat_completion(
             messages=messages,
             max_tokens=500,
             stream=True,
-            temperature=0.7,
         ):
-            if message_chunk.choices and len(message_chunk.choices) > 0:
-                token_text = message_chunk.choices[0].delta.content
-                if token_text:
-                    response += token_text
-                    yield response
     except Exception as e:
-        # Если всё же упало, выводим причину
-        yield f"Flare столкнулся с ошибкой. Попробуй еще раз через 5 секунд. (Текст ошибки: {str(e)})"
-# Создаем интерфейс без лишних наворотов
-demo = gr.ChatInterface(
-    fn=respond,
-    title="Flare AI",
-    description="Стабильная версия ассистента"
-)
 if __name__ == "__main__":
     demo.launch()

 from huggingface_hub import InferenceClient
 import os
+# Используем максимально надежный токен и модель
 token = os.getenv("HF_TOKEN")
 client = InferenceClient("meta-llama/Llama-3.2-3B-Instruct", token=token)
+def chat_fn(message, history):
+    # Flare всегда представляется и помнит инструкцию
+    messages = [{"role": "system", "content": "Ты — профессиональный ИИ-ассистент Flare. Пиши грамотно на русском."}]
+    # Добавляем историю (ограничим 5 последними сообщениями)
+    for user_msg, assistant_msg in history[-5:]:
+        messages.append({"role": "user", "content": user_msg})
+        messages.append({"role": "assistant", "content": assistant_msg})
+    # Добавляем текущий вопрос
+    messages.append({"role": "user", "content": message})
     response = ""
     try:
+        # Запрашиваем ответ
+        for msg in client.chat_completion(
             messages=messages,
             max_tokens=500,
             stream=True,
+            temperature=0.7
         ):
+            token_text = msg.choices[0].delta.content
+            if token_text:
+                response += token_text
+                yield response
     except Exception as e:
+        yield f"Flare: Ошибка сервера ({str(e)}). Попробуй отправить еще раз."
+# Создаем интерфейс вручную
+with gr.Blocks() as demo:
+    gr.Markdown("# Flare AI Assistant")
+    chatbot = gr.Chatbot(label="Чат с Flare")
+    msg = gr.Textbox(label="Ваш вопрос", placeholder="Напишите здесь...")
+    clear = gr.Button("Очистить чат")
+    # Логика отправки
+    def user_input(user_message, history):
+        return "", history + [[user_message, None]]
+    def bot_output(history):
+        user_message = history[-1][0]
+        history[-1][1] = ""
+        for chunk in chat_fn(user_message, history[:-1]):
+            history[-1][1] = chunk
+            yield history
+    msg.submit(user_input, [msg, chatbot], [msg, chatbot], queue=False).then(
+        bot_output, chatbot, chatbot
+    )
+    clear.click(lambda: None, None, chatbot, queue=False)
 if __name__ == "__main__":
     demo.launch()