Spaces:

FrostIce
/

WebAgent

Build error

App Files Files Community

FrostIce commited on Oct 29, 2025

Commit

5efbcc2

verified ·

1 Parent(s): 7fe6dd7

Update app.py

Browse files

Files changed (1) hide show

app.py +137 -45

app.py CHANGED Viewed

@@ -1,14 +1,50 @@
-# app.py
-import gradio as gr
-from g4f.client import Client
-client = Client()
-# --- Обработчик диалога ---
-def respond(message, history):
-    # Добавляем системное сообщение только при старте истории
-    messages = [{"role": "system", "content": """
-You are a Web‑assistant. For every user request return **exactly one JSON object**
 with the following possible fields:
 {
   "TEXT": "<optional short explanation>",
@@ -25,72 +61,128 @@ with the following possible fields:
   }
 }
 If you don't need any action, set all fields to null or empty strings.
-"""}]
-    for human, assistant in history:
-        messages.append({"role": "user", "content": human})
-        messages.append({"role": "assistant", "content": assistant})
-    messages.append({"role": "user", "content": message})
     try:
-        response = client.chat.completions.create(
-            model="HuggingFaceH4/zephyr-7b-beta",
-            messages=messages
         )
-        bot_message = response.choices[0].message.content
-    except Exception as e:
-        bot_message = f"Ошибка: {str(e)}"
-    # Возвращаем обновлённую историю + новый ответ
     return history + [[message, bot_message]]
-# --- Интерфейс ---
-with gr.Blocks(title="ESP Brain") as demo:
-    gr.Markdown("## For api")
-    chatbot = gr.Chatbot(
-        height=600,
-    )
     with gr.Row():
         txt = gr.Textbox(
-            placeholder="Напиши сообщение...",
             show_label=False,
-            scale=8
         )
         submit_btn = gr.Button("Отправить", scale=2)
     with gr.Row():
-        retry_btn = gr.Button("🔄 Повторить")
-        undo_btn = gr.Button("↩️ Отменить")
-        clear_btn = gr.Button("🗑️ Очистить")
-    # Логика
     txt.submit(fn=respond, inputs=[txt, chatbot], outputs=chatbot)
     submit_btn.click(fn=respond, inputs=[txt, chatbot], outputs=chatbot)
     def retry_last(history):
         if history:
-            last_user_msg = history[-1][0]
-            return history[:-1] + [[last_user_msg, None]]  # очищаем ответ
         return history
     retry_btn.click(fn=retry_last, inputs=chatbot, outputs=chatbot, queue=False)
     def undo_last(history):
         return history[:-1]
     undo_btn.click(fn=undo_last, inputs=chatbot, outputs=chatbot, queue=False)
     clear_btn.click(lambda: [], outputs=chatbot, queue=False)
-# --- Запуск ---
 if __name__ == "__main__":
     demo.queue()
     demo.launch(
-        share=True,
         ssr_mode=False,
-        debug=True
-    )

+# -------------------------------------------------------------
+#   app.py   –  Gradio‑чат с локальной LLaMA‑моделью
+# -------------------------------------------------------------
+import os
+import json
+import pathlib
+import gc
+from typing import List, Tuple, Any
+import gradio as gr
+from llama_cpp import Llama
+from huggingface_hub import snapshot_download
+# ------------------------------------------------------------------
+# 1️⃣ Загрузка модели из HuggingFace (необходимо один раз)
+# ------------------------------------------------------------------
+MODEL_REPO   = "neuphonic/neutts-air"
+MODEL_FILE   = "neutss-air-BF16.gguf"
+CACHE_DIR    = os.getenv("HF_HOME", pathlib.Path.home() / ".cache" / "huggingface" / "hub")
+print("🔎 Скачиваем модель (может занять несколько минут)...")
+model_path = snapshot_download(
+    repo_id=MODEL_REPO,
+    revision="main",
+    cache_dir=str(CACHE_DIR),
+    local_files_only=False,          # False → скачивает, если нет локально
+    allow_patterns=[MODEL_FILE],
+)
+gguf_path = os.path.join(model_path, MODEL_FILE)
+print(f"✅ Модель скачана в {gguf_path}")
+# ------------------------------------------------------------------
+# 2️⃣ Инициализация Llama‑CPP (GPU/CPU зависит от того, как установлен пакет)
+# ------------------------------------------------------------------
+llm = Llama(
+    model_path=gguf_path,
+    n_ctx=2048,          # длина контекста (можно увеличить, если хватает VRAM)
+    n_threads=8,         # количество CPU‑ядер
+    n_gpu_layers=-1,     # -1 → попытаться использовать всё доступное GPU (если сборка поддерживает)
+    verbose=False,
+)
+# ------------------------------------------------------------------
+# 3️⃣ Системный промпт – будет всегда первой репликой
+# ------------------------------------------------------------------
+SYSTEM_PROMPT = """You are a Web‑assistant. For every user request return **exactly one JSON object**
 with the following possible fields:
 {
   "TEXT": "<optional short explanation>",
   }
 }
 If you don't need any action, set all fields to null or empty strings.
+"""
+# ------------------------------------------------------------------
+# 4️⃣ Вспомогательная функция: формируем запрос в стиле OpenAI‑Chat
+# ------------------------------------------------------------------
+def build_chat(messages: List[Tuple[str, str]]) -> str:
+    """
+    Преобразуем историю (list of (human,assistant)) в один строковый prompt,
+    совместимый с Llama‑CPP, где каждая реплика отделяется тегами <|user|>,
+    <|assistant|> и <|system|>.
+    """
+    prompt = f"<|system|>{SYSTEM_PROMPT}<|end|>"
+    for human, assistant in messages:
+        prompt += f"<|user|>{human}<|end|>"
+        prompt += f"<|assistant|>{assistant}<|end|>"
+    return prompt
+# ------------------------------------------------------------------
+# 5️⃣ Основная бизнес‑логика – генерация ответа модели
+# ------------------------------------------------------------------
+def respond(message: str, history: List[List[str]]) -> List[List[Any]]:
+    """
+    Принимает новое сообщение пользователя и текущую историю чата.
+    Возвращает обновлённую историю, где второй элемент списка – JSON‑строка
+    модели (или сообщение об ошибке).
+    """
+    # 1️⃣ Преобразуем историю в формат (human,assistant)
+    chat_history = [(h, a) for h, a in history]  # тип List[Tuple[str,str]]
+    # 2️⃣ Формируем полный prompt
+    prompt = build_chat(chat_history + [(message, "")])  # последняя реплика ещё пустая
+    # 3️⃣ Генерируем ответ (при необходимости задаём stop���строку)
     try:
+        # Параметры генерации можно подкорректировать:
+        #   temperature – креативность,
+        #   top_p – сэмплинг,
+        #   max_tokens – длина ответа.
+        out = llm(
+            prompt,
+            max_tokens=512,
+            temperature=0.2,
+            top_p=0.95,
+            repeat_penalty=1.1,
+            stop=["<|assistant|>", "<|user|>", "<|system|>"],  # остановка перед новым turn'ом
         )
+        raw = out["choices"][0]["text"].strip()
+        # Иногда модель генерирует лишний текст (например, объяснение) перед JSON.
+        # Попытаемся вырезать первый валидный JSON‑объект.
+        try:
+            # Находим первую фигурную скобку
+            start = raw.find("{")
+            json_part = raw[start:] if start != -1 else raw
+            parsed = json.loads(json_part)
+        except Exception:
+            # Если парсинг не удалось – считаем, что модель отдала обычный текст
+            parsed = {"TEXT": raw, "WEBSITE": "", "SEARCH": "", "SUGGESTIONS": [], "TOOL": {}}
+    except Exception as exc:
+        parsed = {"TEXT": f"Ошибка модели: {str(exc)}",
+                  "WEBSITE": "", "SEARCH": "", "SUGGESTIONS": [], "TOOL": {}}
+    # Приводим к строке, чтобы отобразить в чат‑боте
+    bot_message = json.dumps(parsed, ensure_ascii=False, indent=2)
+    # 4️⃣ Возвращаем обновленную историю
     return history + [[message, bot_message]]
+# ------------------------------------------------------------------
+# 6️⃣ Gradio‑интерфейс (не менялся)
+# ------------------------------------------------------------------
+with gr.Blocks(title="ESP Brain – локальная LLaMA") as demo:
+    gr.Markdown("## 🤖 Web‑assistant powered by **neutts‑air** (LLaMA‑CPP)")
+    chatbot = gr.Chatbot(height=600)
     with gr.Row():
         txt = gr.Textbox(
+            placeholder="Напиши сообщение…",
             show_label=False,
+            scale=8,
         )
         submit_btn = gr.Button("Отправить", scale=2)
     with gr.Row():
+        retry_btn = gr.Button("🔄 Повторить")
+        undo_btn  = gr.Button("↩️ Отменить")
+        clear_btn = gr.Button("🗑️ Очистить")
+    # -------------------------------------------------------------
+    #   Логика кнопок
+    # -------------------------------------------------------------
     txt.submit(fn=respond, inputs=[txt, chatbot], outputs=chatbot)
     submit_btn.click(fn=respond, inputs=[txt, chatbot], outputs=chatbot)
     def retry_last(history):
+        """Очистить последний ответ, чтобы пользователь мог написать заново."""
         if history:
+            last_user = history[-1][0]
+            return history[:-1] + [[last_user, None]]
         return history
     retry_btn.click(fn=retry_last, inputs=chatbot, outputs=chatbot, queue=False)
     def undo_last(history):
+        """Удалить последнюю пару (user‑assistant)."""
         return history[:-1]
     undo_btn.click(fn=undo_last, inputs=chatbot, outputs=chatbot, queue=False)
     clear_btn.click(lambda: [], outputs=chatbot, queue=False)
+# ------------------------------------------------------------------
+# 7️⃣ Запуск приложения
+# ------------------------------------------------------------------
 if __name__ == "__main__":
+    # Включаем очередь, чтобы несколько запросов не конфликтовали с GPU/CPU
     demo.queue()
     demo.launch(
+        share=True,          # получить публичный https‑линк (опционально)
         ssr_mode=False,
+        debug=True,
+    )