Spaces:

FrostIce
/

WebAgent

Build error

App Files Files Community

FrostIce commited on Oct 30, 2025

Commit

d8e8db4

verified ·

1 Parent(s): 5efbcc2

Update app.py

Browse files

Files changed (1) hide show

app.py +39 -133

app.py CHANGED Viewed

@@ -1,50 +1,13 @@
-# -------------------------------------------------------------
-#   app.py   –  Gradio‑чат с локальной LLaMA‑моделью
-# -------------------------------------------------------------
-import os
-import json
-import pathlib
-import gc
-from typing import List, Tuple, Any
 import gradio as gr
-from llama_cpp import Llama
-from huggingface_hub import snapshot_download
-# ------------------------------------------------------------------
-# 1️⃣ Загрузка модели из HuggingFace (необходимо один раз)
-# ------------------------------------------------------------------
-MODEL_REPO   = "neuphonic/neutts-air"
-MODEL_FILE   = "neutss-air-BF16.gguf"
-CACHE_DIR    = os.getenv("HF_HOME", pathlib.Path.home() / ".cache" / "huggingface" / "hub")
-print("🔎 Скачиваем модель (может занять несколько минут)...")
-model_path = snapshot_download(
-    repo_id=MODEL_REPO,
-    revision="main",
-    cache_dir=str(CACHE_DIR),
-    local_files_only=False,          # False → скачивает, если нет локально
-    allow_patterns=[MODEL_FILE],
-)
-gguf_path = os.path.join(model_path, MODEL_FILE)
-print(f"✅ Модель скачана в {gguf_path}")
-# ------------------------------------------------------------------
-# 2️⃣ Инициализация Llama‑CPP (GPU/CPU зависит от того, как установлен пакет)
-# ------------------------------------------------------------------
-llm = Llama(
-    model_path=gguf_path,
-    n_ctx=2048,          # длина контекста (можно увеличить, если хватает VRAM)
-    n_threads=8,         # количество CPU‑ядер
-    n_gpu_layers=-1,     # -1 → попытаться использовать всё доступное GPU (если сборка поддерживает)
-    verbose=False,
-)
-# ------------------------------------------------------------------
-# 3️⃣ Системный промпт – будет всегда первой репликой
-# ------------------------------------------------------------------
-SYSTEM_PROMPT = """You are a Web‑assistant. For every user request return **exactly one JSON object**
 with the following possible fields:
 {
   "TEXT": "<optional short explanation>",
@@ -61,128 +24,71 @@ with the following possible fields:
   }
 }
 If you don't need any action, set all fields to null or empty strings.
-"""
-# ------------------------------------------------------------------
-# 4️⃣ Вспомогательная функция: формируем запрос в стиле OpenAI‑Chat
-# ------------------------------------------------------------------
-def build_chat(messages: List[Tuple[str, str]]) -> str:
-    """
-    Преобразуем историю (list of (human,assistant)) в один строковый prompt,
-    совместимый с Llama‑CPP, где каждая реплика отделяется тегами <|user|>,
-    <|assistant|> и <|system|>.
-    """
-    prompt = f"<|system|>{SYSTEM_PROMPT}<|end|>"
-    for human, assistant in messages:
-        prompt += f"<|user|>{human}<|end|>"
-        prompt += f"<|assistant|>{assistant}<|end|>"
-    return prompt
-# ------------------------------------------------------------------
-# 5️⃣ Основная бизнес‑логика – генерация ответа модели
-# ------------------------------------------------------------------
-def respond(message: str, history: List[List[str]]) -> List[List[Any]]:
-    """
-    Принимает новое сообщение пользователя и текущую историю чата.
-    Возвращает обновлённую историю, где второй элемент списка – JSON‑строка
-    модели (или сообщение об ошибке).
-    """
-    # 1️⃣ Преобразуем историю в формат (human,assistant)
-    chat_history = [(h, a) for h, a in history]  # тип List[Tuple[str,str]]
-    # 2️⃣ Формируем полный prompt
-    prompt = build_chat(chat_history + [(message, "")])  # последняя реплика ещё пустая
-    # 3️⃣ Генерируем ответ (при необходимости задаём stop‑строку)
     try:
-        # Параметры генерации можно подкорректировать:
-        #   temperature – креативность,
-        #   top_p – сэмплинг,
-        #   max_tokens – длина ответа.
-        out = llm(
-            prompt,
-            max_tokens=512,
-            temperature=0.2,
-            top_p=0.95,
-            repeat_penalty=1.1,
-            stop=["<|assistant|>", "<|user|>", "<|system|>"],  # остановка перед новым turn'ом
         )
-        raw = out["choices"][0]["text"].strip()
-        # Иногда модель генерирует лишний текст (например, объяснение) перед JSON.
-        # Попытаемся вырезать первый валидный JSON‑объект.
-        try:
-            # Находим первую фигурную скобку
-            start = raw.find("{")
-            json_part = raw[start:] if start != -1 else raw
-            parsed = json.loads(json_part)
-        except Exception:
-            # Если парсинг не удалось – считаем, что модель отдала обычный текст
-            parsed = {"TEXT": raw, "WEBSITE": "", "SEARCH": "", "SUGGESTIONS": [], "TOOL": {}}
-    except Exception as exc:
-        parsed = {"TEXT": f"Ошибка модели: {str(exc)}",
-                  "WEBSITE": "", "SEARCH": "", "SUGGESTIONS": [], "TOOL": {}}
-    # Приводим к строке, чтобы отобразить в чат‑боте
-    bot_message = json.dumps(parsed, ensure_ascii=False, indent=2)
-    # 4️⃣ Возвращаем обновленную историю
     return history + [[message, bot_message]]
-# ------------------------------------------------------------------
-# 6️⃣ Gradio‑интерфейс (не менялся)
-# ------------------------------------------------------------------
-with gr.Blocks(title="ESP Brain – локальная LLaMA") as demo:
-    gr.Markdown("## 🤖 Web‑assistant powered by **neutts‑air** (LLaMA‑CPP)")
-    chatbot = gr.Chatbot(height=600)
     with gr.Row():
         txt = gr.Textbox(
-            placeholder="Напиши сообщение…",
             show_label=False,
-            scale=8,
         )
         submit_btn = gr.Button("Отправить", scale=2)
     with gr.Row():
-        retry_btn = gr.Button("🔄 Повторить")
-        undo_btn  = gr.Button("↩️ Отменить")
-        clear_btn = gr.Button("🗑️ Очистить")
-    # -------------------------------------------------------------
-    #   Логика кнопок
-    # -------------------------------------------------------------
     txt.submit(fn=respond, inputs=[txt, chatbot], outputs=chatbot)
     submit_btn.click(fn=respond, inputs=[txt, chatbot], outputs=chatbot)
     def retry_last(history):
-        """Очистить последний ответ, чтобы пользователь мог написать заново."""
         if history:
-            last_user = history[-1][0]
-            return history[:-1] + [[last_user, None]]
         return history
     retry_btn.click(fn=retry_last, inputs=chatbot, outputs=chatbot, queue=False)
     def undo_last(history):
-        """Удалить последнюю пару (user‑assistant)."""
         return history[:-1]
     undo_btn.click(fn=undo_last, inputs=chatbot, outputs=chatbot, queue=False)
     clear_btn.click(lambda: [], outputs=chatbot, queue=False)
-# ------------------------------------------------------------------
-# 7️⃣ Запуск приложения
-# ------------------------------------------------------------------
 if __name__ == "__main__":
-    # Включаем очередь, чтобы несколько запросов не конфликтовали с GPU/CPU
     demo.queue()
     demo.launch(
-        share=True,          # получить публичный https‑линк (опционально)
         ssr_mode=False,
-        debug=True,
-    )

+# app.py
 import gradio as gr
+from g4f.client import Client
+client = Client()
+# --- Обработчик диалога ---
+def respond(message, history):
+    # Добавляем системное сообщение только при старте истории
+    messages = [{"role": "system", "content": """You are a Web‑assistant. For every user request return **exactly one JSON object**
 with the following possible fields:
 {
   "TEXT": "<optional short explanation>",
   }
 }
 If you don't need any action, set all fields to null or empty strings.
+"""}]
+    for human, assistant in history:
+        messages.append({"role": "user", "content": human})
+        messages.append({"role": "assistant", "content": assistant})
+    messages.append({"role": "user", "content": message})
     try:
+        response = client.chat.completions.create(
+            model="deepseek-v3",
+            messages=messages
         )
+        bot_message = response.choices[0].message.content
+    except Exception as e:
+        bot_message = f"Ошибка: {str(e)}"
+    # Возвращаем обновлённую историю + новый ответ
     return history + [[message, bot_message]]
+# --- Интерфейс ---
+with gr.Blocks(title="ESP Brain") as demo:
+    gr.Markdown("## For api")
+    chatbot = gr.Chatbot(
+        height=600,
+    )
     with gr.Row():
         txt = gr.Textbox(
+            placeholder="Напиши сообщение...",
             show_label=False,
+            scale=8
         )
         submit_btn = gr.Button("Отправить", scale=2)
     with gr.Row():
+        retry_btn = gr.Button("🔄 Повторить")
+        undo_btn = gr.Button("↩️ Отменить")
+        clear_btn = gr.Button("🗑️ Очистить")
+    # Логика
     txt.submit(fn=respond, inputs=[txt, chatbot], outputs=chatbot)
     submit_btn.click(fn=respond, inputs=[txt, chatbot], outputs=chatbot)
     def retry_last(history):
         if history:
+            last_user_msg = history[-1][0]
+            return history[:-1] + [[last_user_msg, None]]  # очищаем ответ
         return history
     retry_btn.click(fn=retry_last, inputs=chatbot, outputs=chatbot, queue=False)
     def undo_last(history):
         return history[:-1]
     undo_btn.click(fn=undo_last, inputs=chatbot, outputs=chatbot, queue=False)
     clear_btn.click(lambda: [], outputs=chatbot, queue=False)
+# --- Запуск ---
 if __name__ == "__main__":
     demo.queue()
     demo.launch(
+        share=True,
         ssr_mode=False,
+        debug=True
+    )