Spaces:

HaveAI
/

Flare_alpha

Sleeping

App Files Files Community

HaveAI commited on Apr 15

Commit

5bab3a0

verified ·

1 Parent(s): 2cd32e2

Update app.py

Browse files

Files changed (1) hide show

app.py +24 -21

app.py CHANGED Viewed

@@ -1,27 +1,29 @@
 import gradio as gr
-# Самый простой и надежный способ вызова модели в Hugging Face Spaces
-# Мы используем встроенный метод загрузки, который сам следит за сессиями
 def predict(message, history):
-    # Системный промпт приклеиваем к сообщению
-    # В этой модели это самый стабильный способ сохранить личность
-    prompt = f"System: Тебя зовут Gemini. Всегда представляйся как Gemini.\nUser: {message}"
-    # Прямой вызов через интерфейс API
-    # Если будет ошибка "list indices", мы её перехватим заранее
     try:
-        model = gr.load("models/moonshotai/Kimi-K2-Thinking", provider="novita")
-        response = model(prompt)
-        # Безопасное извлечение текста
-        if isinstance(response, list) and len(response) > 0:
-            res = response[0]
-            return res.get("generated_text", str(res)) if isinstance(res, dict) else str(res)
-        return str(response)
     except Exception as e:
-        return f"Сервер временно занят. Подожди 10 секунд и попробуй снова. (Ошибка: {str(e)})"
-# Твой сине-желтый дизайн
 custom_theme = gr.themes.Soft(
     primary_hue="yellow",
     secondary_hue="blue",
@@ -30,14 +32,15 @@ custom_theme = gr.themes.Soft(
     block_background_fill="#ffdd00",
 )
-with gr.Blocks(theme=custom_theme, fill_height=True) as demo:
     with gr.Sidebar():
         gr.Markdown("# **FlareAI**")
-        gr.Markdown("Твой ассистент Gemini")
         gr.LoginButton("Войти")
-    # Используем простую версию чата без сложных настроек
     gr.ChatInterface(fn=predict)
-# Запускаем без лишних параметров, чтобы не было конфликтов с браузером
 demo.launch()

 import gradio as gr
+from huggingface_hub import InferenceClient
+# Создаем клиента. Он сам найдет HF_TOKEN в секретах Space.
+client = InferenceClient("moonshotai/Kimi-K2-Thinking")
 def predict(message, history):
+    # Формируем историю для модели
+    messages = [{"role": "system", "content": "Тебя зовут Gemini. Ты — ассистент FlareAI."}]
+    # Добавляем прошлые сообщения
+    for user_msg, bot_msg in history:
+        messages.append({"role": "user", "content": user_msg})
+        messages.append({"role": "assistant", "content": bot_msg})
+    # Добавляем текущий вопрос
+    messages.append({"role": "user", "content": message})
     try:
+        # Вызываем модель без стриминга для максимальной стабильности
+        response = client.chat_completion(messages, max_tokens=512)
+        return response.choices[0].message.content
     except Exception as e:
+        return f"Ошибка: {str(e)}. Попробуй еще раз через пару секунд."
+# Сине-желтый дизайн
 custom_theme = gr.themes.Soft(
     primary_hue="yellow",
     secondary_hue="blue",
     block_background_fill="#ffdd00",
 )
+css = ".gradio-container { background-color: #0057b7 !important; }"
+with gr.Blocks(theme=custom_theme, css=css) as demo:
     with gr.Sidebar():
         gr.Markdown("# **FlareAI**")
+        gr.Markdown("Ассистент: Gemini")
         gr.LoginButton("Войти")
+    # В Gradio 6.0 лучше не передавать лишних аргументов в ChatInterface
     gr.ChatInterface(fn=predict)
 demo.launch()