Spaces:

KennyOry
/

PrintAI

Sleeping

App Files Files Community

KennyOry commited on Aug 13, 2025

Commit

1820b13

verified ·

1 Parent(s): 9174fd2

Update app.py

Browse files

Files changed (1) hide show

app.py +106 -36

app.py CHANGED Viewed

@@ -1,6 +1,5 @@
 from flask import Flask, render_template, request, Response, jsonify
 from llama_cpp import Llama
-from duckduckgo_search import DDGS
 import logging
 import time
 import requests
@@ -17,8 +16,8 @@ app.secret_key = 'super_secret_key'
 message_queue = queue.Queue()
 # Конфигурация модели
-MODEL_REPO = "Orenguteng/Llama-3-8B-Lexi-Uncensored-GGUF"
-MODEL_FILE = "Lexi-Llama-3-8B-Uncensored_Q5_K_M.gguf"
 # Загрузка модели при запуске
 MODEL_PATH = hf_hub_download(
@@ -51,16 +50,27 @@ SYSTEM_PROMPT = """
 1. Формат ответа строго:
    **Проблема:** [краткое описание]
    **Решение:** [пошаговые действия]
-   **Источники:** [1], [2], [3]
-2. В решении включай ВСЕ ключевые шаги из найденной информации
 4. Не добавляй дополнительные разделы после "Источники"
 5. Не дублируй разделы
-6. Будь краток (3-5 предложений)
 7. Используй точные технические термины
 8. Указывай артикулы деталей при замене
 9. Отвечай ТОЛЬКО на русском языке
 """
 logging.basicConfig(
     level=logging.INFO,
     format='%(asctime)s - %(levelname)s - %(message)s',
@@ -163,38 +173,71 @@ def generate_search_query(prompt: str) -> dict:
         }
 def web_search(query: str) -> tuple:
-    """Бесплатный поиск через DuckDuckGo с русскоязычными результатами"""
-    try:
-        message_queue.put(('log', f"🔍 Поиск в интернете: {query}"))
         start_time = time.time()
-        with DDGS() as ddgs:
-            results = []
-            for r in ddgs.text(
-                query,
-                safesearch='off',
-                max_results=MAX_RESULTS
-            ):
-                results.append(r)
         combined_content = ""
         sources = []
-        for i, res in enumerate(results):
-            snippet = res.get("body", "")
             title = res.get("title", "Без заголовка")
-            url = res.get("href", "#")
-            # Очищаем HTML-теги из сниппетов
             cleaned_snippet = re.sub(r'<[^>]+>', '', snippet)
             combined_content += f"[[Источник {i+1}]] {title}\n{cleaned_snippet}\n\n"
-            sources.append({"title": title, "url": url})
         elapsed = time.time() - start_time
-        message_queue.put(('log', f"✅ Найдено результатов: {len(results)} за {elapsed:.2f}с"))
-        return combined_content[:3000], sources  # Ограничиваем длину контекста
     except Exception as e:
-        error_msg = f"❌ DuckDuckGo ошибка: {str(e)}"
         message_queue.put(('log', error_msg))
         return f"Поиск недоступен: {str(e)}", []
@@ -226,29 +269,56 @@ def process_query(prompt: str):
     try:
         start_time = time.time()
         message_queue.put(('log', f"👤 Запрос: {prompt}"))
         # Извлекаем данные
         norm_data = generate_search_query(prompt)
-        message_queue.put(('log', f"🔍 Извлечено: {json.dumps(norm_data, ensure_ascii=False)}"))
         # Выполняем поиск
         search_data, sources = web_search(norm_data['search_query'])
-        message_queue.put(('log', f"📚 Результаты поиска: {len(search_data)} символов, источники: {len(sources)}"))
-        # Формируем промпт
         sources_text = "\n".join([f"[{i+1}] {s['title']} - {s['url']}" for i, s in enumerate(sources)])
         response_prompt = f"""
         <|system|>{SYSTEM_PROMPT}
         Контекст:
         Бренд: {norm_data['brand']}
         Модель: {norm_data['model']}
         Ошибка: {norm_data['error_code']}
-        Проблема: {norm_data['problem_description']}
         Данные поиска:
         {search_data}
         Список источников (для справки, не включай в ответ):
         {sources_text}
         </s>
@@ -256,7 +326,7 @@ def process_query(prompt: str):
         <|assistant|>
         """
-        message_queue.put(('log', "🧠 Генерация ответа..."))
         message_queue.put(('response_start', ""))
         # Генерируем ответ

 from flask import Flask, render_template, request, Response, jsonify
 from llama_cpp import Llama
 import logging
 import time
 import requests
 message_queue = queue.Queue()
 # Конфигурация модели
+MODEL_REPO = "QuantFactory/Meta-Llama-3-8B-Instruct-GGUF"
+MODEL_FILE = "Meta-Llama-3-8B-Instruct.Q5_K_M.gguf"
 # Загрузка модели при запуске
 MODEL_PATH = hf_hub_download(
 1. Формат ответа строго:
    **Проблема:** [краткое описание]
    **Решение:** [пошаговые действия]
+2. В решении включай ВСЕ шаги из найденной информации
+3. Шаги решения нумеруй цифрами с точкой (1., 2., 3.)
 4. Не добавляй дополнительные разделы после "Источники"
 5. Не дублируй разделы
+6. Будь краток, но исчерпывающе
 7. Используй точные технические термины
 8. Указывай артикулы деталей при замене
 9. Отвечай ТОЛЬКО на русском языке
+10. Всегда проверяй точность кодов ошибок
 """
+BLACKLISTED_DOMAINS = [
+    'reddit.com',
+    'stackoverflow.com',
+    'quora.com',
+    'facebook.com',
+    'youtube.com',
+    'x.com',
+    'twitter.com'
+]
 logging.basicConfig(
     level=logging.INFO,
     format='%(asctime)s - %(levelname)s - %(message)s',
         }
 def web_search(query: str) -> tuple:
+        message_queue.put(('log', f"🔍 Провожу поиск по запросу: {query}"))
         start_time = time.time()
+        SERPAPI_KEY = "31c06fe621064f426c444cbdae5bd3821dd0572a6d23f445896ad5f3df6dc634"
+        params = {
+            "api_key": SERPAPI_KEY,
+            "engine": "google",
+            "q": query,
+            "hl": "ru",
+            "gl": "ru",
+            "num": 10,
+            "safe": "off",
+        }
+        response = requests.get("https://serpapi.com/search", params=params, timeout=15)
+        response.raise_for_status()
+        data = response.json()
         combined_content = ""
         sources = []
+        # --- Добавляем Featured Snippet (автоответ Google) ---
+        featured_snippet = data.get("featured_snippet", {})
+        if featured_snippet:
+            snippet = featured_snippet.get("snippet", "")
+            if snippet:
+                combined_content += f"[Автоответ Google]\n{snippet}\n\n"
+                sources.insert(0, {
+                    "title": "Google — автоматический ответ",
+                    "url": f"https://www.google.com/search?q={requests.utils.quote(query)}"
+                })
+        # --- Добавляем Knowledge Panel (если есть) ---
+        knowledge_panel = data.get("knowledge_panel", {})
+        if knowledge_panel:
+            title = knowledge_panel.get("title", "")
+            description = knowledge_panel.get("description", "")
+            if description:
+                combined_content += f"[Knowledge Panel] {title}\n{description}\n\n"
+        # --- Органические результаты ---
+        organic_results = data.get("organic_results", [])
+        for i, res in enumerate(organic_results):
             title = res.get("title", "Без заголовка")
+            link = res.get("link", "#")
+            snippet = res.get("snippet", "") or ""
+            # Фильтр по чёрному списку
+            if any(domain in link for domain in BLACKLISTED_DOMAINS):
+                continue
             cleaned_snippet = re.sub(r'<[^>]+>', '', snippet)
             combined_content += f"[[Источник {i+1}]] {title}\n{cleaned_snippet}\n\n"
+            sources.append({"title": title, "url": link})
+            if len(sources) >= MAX_RESULTS:
+                break
         elapsed = time.time() - start_time
+        message_queue.put(('log', f"✅ Поиск был произведен за {elapsed:.2f}с"))
+        return combined_content[:6000], sources  # увеличили лимит для лучшего контекста
     except Exception as e:
+        error_msg = f"❌ SerpAPI ошибка: {str(e)}"
         message_queue.put(('log', error_msg))
         return f"Поиск недоступен: {str(e)}", []
     try:
         start_time = time.time()
         message_queue.put(('log', f"👤 Запрос: {prompt}"))
+        message_queue.put(('log', f"⚙️ Извлекаю параметры из входящего запроса"))
         # Извлекаем данные
         norm_data = generate_search_query(prompt)
+        message_queue.put(('log', f"⏏️ Извлечено: {json.dumps(norm_data, ensure_ascii=False)}"))
         # Выполняем поиск
         search_data, sources = web_search(norm_data['search_query'])
+        message_queue.put(('log', f"📚 Собрано: {len(search_data)} символов в {len(sources)} источнике(-ах)"))
+        message_queue.put(('log', f"⚙️ Определяю проблему"))
+        problem_analysis_prompt = f"""
+        <|system|>
+        Опиши СУТЬ проблемы в одном предложении.
+        Только диагноз, без решений, действий или рекомендаций.
+        Не более 12 слов. На русском.
+        </s>
+        <|user|>
+        Запрос пользователя: {prompt}
+        Поисковые данные:
+        {search_data}
+        </s>
+        <|assistant|>
+        """
+        problem_response = llm(
+            problem_analysis_prompt,
+            max_tokens=150,
+            temperature=0.2,
+            stop=["</s>", "<|user|>"]
+        )
+        extracted_problem = problem_response['choices'][0]['text'].strip()
+        if not extracted_problem or len(extracted_problem) < 5:
+            extracted_problem = f"Неисправность {norm_data['brand']} {norm_data['model']}"
+        message_queue.put(('log', f"🧩 Определённая проблема: {extracted_problem}"))
         sources_text = "\n".join([f"[{i+1}] {s['title']} - {s['url']}" for i, s in enumerate(sources)])
         response_prompt = f"""
         <|system|>{SYSTEM_PROMPT}
         Контекст:
         Бренд: {norm_data['brand']}
         Модель: {norm_data['model']}
         Ошибка: {norm_data['error_code']}
+        Суть проблемы (на основе поиска): {extracted_problem}
         Данные поиска:
         {search_data}
         Список источников (для справки, не включай в ответ):
         {sources_text}
         </s>
         <|assistant|>
         """
+        message_queue.put(('log', "🧠 На основе полученных данных генерирую ответ..."))
         message_queue.put(('response_start', ""))
         # Генерируем ответ