Spaces:

PatrickRedStar
/

MultiAgentLogsAnalyze

Sleeping

App Files Files Community

PatrickRedStar commited on Jan 9

Commit

758bfb1

1 Parent(s): 9043954

Fix: Improve agent response extraction and add better error handling for truncated JSON

Browse files

Files changed (3) hide show

agents/__init__.py +15 -10
agents/__pycache__/__init__.cpython-314.pyc +0 -0
utils/agent_runner.py +86 -10

agents/__init__.py CHANGED Viewed

@@ -23,7 +23,7 @@ if not hf_token:
 model = InferenceClientModel(
     model_id="deepseek-ai/DeepSeek-V3.1-Terminus",
     token=hf_token,
-    max_tokens=2048
 )
 final_tool = FinalAnswerTool()
@@ -35,6 +35,8 @@ parser_agent = ToolCallingAgent(
     instructions="""
 Ты эксперт по анализу системных логов. Твоя задача - парсить сырые логи и преобразовывать их в структурированный JSON формат.
 Для каждой строки лога определи:
 - timestamp: временная метка (если есть)
 - level: уровень логирования (INFO, WARNING, ERROR, CRITICAL, DEBUG, TRACE)
@@ -48,7 +50,7 @@ parser_agent = ToolCallingAgent(
 Временной диапазон (time_range) должен содержать start и end - первую и последнюю временную метку.
-Ответ строго верни в JSON через final_answer в следующем формате:
 {
   "events": [{"line_number": int, "timestamp": "str|null", "level": "str", "message": "str", "type": "str"}, ...],
   "errors": [{"line_number": int, "timestamp": "str|null", "level": "str", "message": "str", "type": "str"}, ...],
@@ -221,17 +223,20 @@ def run_gpt_prompt_agent(structured_data: dict, anomaly_report: dict, recommenda
     }
     input_json = json.dumps(input_data, ensure_ascii=False, indent=2)
-    result = run_agent_safely(gpt_prompt_agent, task=input_json)
-    # Результат должен быть строкой (промпт), а не JSON
-    if isinstance(result, dict) and "answer" in result:
-        return result["answer"]
-    elif isinstance(result, str):
         return result
-    else:
-        # Если агент вернул JSON, попробуем извлечь промпт
-        if isinstance(result, dict) and "prompt" in result:
             return result["prompt"]
         return str(result)
 __all__ = [

 model = InferenceClientModel(
     model_id="deepseek-ai/DeepSeek-V3.1-Terminus",
     token=hf_token,
+    max_tokens=4096  # Увеличено для больших промптов и JSON
 )
 final_tool = FinalAnswerTool()
     instructions="""
 Ты эксперт по анализу системных логов. Твоя задача - парсить сырые логи и преобразовывать их в структурированный JSON формат.
+ВАЖНО: Твой ответ должен быть ПОЛНЫМ и ЗАВЕРШЁННЫМ JSON объектом. Не обрезай ответ!
 Для каждой строки лога определи:
 - timestamp: временная метка (если есть)
 - level: уровень логирования (INFO, WARNING, ERROR, CRITICAL, DEBUG, TRACE)
 Временной диапазон (time_range) должен содержать start и end - первую и последнюю временную метку.
+Ответ строго верни в JSON через final_answer в следующем формате (ОБЯЗАТЕЛЬНО ПОЛНЫЙ JSON):
 {
   "events": [{"line_number": int, "timestamp": "str|null", "level": "str", "message": "str", "type": "str"}, ...],
   "errors": [{"line_number": int, "timestamp": "str|null", "level": "str", "message": "str", "type": "str"}, ...],
     }
     input_json = json.dumps(input_data, ensure_ascii=False, indent=2)
+    result = run_agent_safely(gpt_prompt_agent, task=input_json, return_string=True)
+    # Результат должен быть строкой (промпт)
+    if isinstance(result, str):
         return result
+    elif isinstance(result, dict):
+        # Если вернулся словарь, попробуем извлечь текст
+        if "answer" in result:
+            return result["answer"]
+        elif "prompt" in result:
             return result["prompt"]
+        else:
+            return json.dumps(result, ensure_ascii=False, indent=2)
+    else:
         return str(result)
 __all__ = [

agents/__pycache__/__init__.cpython-314.pyc CHANGED Viewed

Binary files a/agents/__pycache__/__init__.cpython-314.pyc and b/agents/__pycache__/__init__.cpython-314.pyc differ

utils/agent_runner.py CHANGED Viewed

@@ -1,17 +1,18 @@
 # utils/agent_runner.py
 import json
-def run_agent_safely(agent, max_retries=3, **kwargs):
     """
     Безопасно запускает агента с повторными попытками при ошибках.
     Args:
         agent: Экземпляр агента smolagents
         max_retries: Максимальное количество попыток
         **kwargs: Аргументы для передачи агенту
     Returns:
-        dict: Распарсенный JSON ответ от агента
     """
     last_error = None
@@ -19,21 +20,96 @@ def run_agent_safely(agent, max_retries=3, **kwargs):
         try:
             result = agent.run(**kwargs)
-            # Извлекаем ответ из результата
-            if isinstance(result, dict) and "answer" in result:
-                raw = result["answer"]
-            else:
                 raw = result
             if not isinstance(raw, str):
-                raise ValueError("Agent output is not a string")
             # Парсим JSON
-            return json.loads(raw)
         except Exception as e:
             last_error = e
-            print(f"[{agent.name}] ❌ Attempt {attempt}/{max_retries} failed: {e}")
     raise ValueError(
         f"[{agent.name}] Failed after {max_retries} attempts.\nLast error: {last_error}"

 # utils/agent_runner.py
 import json
+def run_agent_safely(agent, max_retries=3, return_string=False, **kwargs):
     """
     Безопасно запускает агента с повторными попытками при ошибках.
     Args:
         agent: Экземпляр агента smolagents
         max_retries: Максимальное количество попыток
+        return_string: Если True, возвращает строку вместо парсинга JSON
         **kwargs: Аргументы для передачи агенту
     Returns:
+        dict или str: Распарсенный JSON ответ или строка (в зависимости от return_string)
     """
     last_error = None
         try:
             result = agent.run(**kwargs)
+            # Извлекаем ответ из результата smolagents
+            # smolagents возвращает AgentText объект, который нужно правильно обработать
+            raw = None
+            # Если это AgentText объект (из smolagents), получаем полный текст
+            # AgentText может содержать обрезанный вывод при str(), но полный текст доступен через другие методы
+            if hasattr(result, 'to_string'):
+                raw = result.to_string()
+            elif hasattr(result, 'text'):
+                raw = result.text
+            elif hasattr(result, '__getitem__'):
+                # Если это последовательность или маппинг, пробуем извлечь
+                try:
+                    if 'answer' in result:
+                        raw = result['answer']
+                except:
+                    pass
+            elif isinstance(result, dict):
+                # Ищем ответ в различных возможных полях
+                if "answer" in result:
+                    raw = result["answer"]
+                elif "content" in result:
+                    raw = result["content"]
+                elif "text" in result:
+                    raw = result["text"]
+                elif "response" in result:
+                    raw = result["response"]
+                else:
+                    # Если словарь не содержит текстовых полей, преобразуем в JSON строку
+                    raw = json.dumps(result, ensure_ascii=False)
+            elif isinstance(result, str):
                 raw = result
+            else:
+                # Пробуем преобразовать в строку
+                raw = str(result)
             if not isinstance(raw, str):
+                raise ValueError(f"Agent output is not a string, got {type(raw)}")
+            # Удаляем возможные escape-последовательности и пробелы
+            raw = raw.strip()
+            # Если raw содержит JSON-строку внутри (например, {"answer": "{\"key\": \"value\"}"})
+            # Нужно распарсить внешний JSON, чтобы получить внутренний
+            if raw.startswith('{"') and '"answer"' in raw:
+                try:
+                    # Пробуем распарсить как JSON
+                    outer_json = json.loads(raw)
+                    if isinstance(outer_json, dict) and "answer" in outer_json:
+                        raw = outer_json["answer"]
+                except json.JSONDecodeError:
+                    # Если не получается распарсить, возможно JSON обрезан
+                    # Пробуем найти полный JSON внутри
+                    pass
+            # Если нужно вернуть строку (для GPT Prompt агента)
+            if return_string:
+                return raw
+            # Для JSON агентов - пытаемся распарсить
+            # Если строка обрезана (начинается с { но не заканчивается }), пробуем исправить
+            if raw.startswith('{') and not raw.rstrip().endswith('}'):
+                # Пытаемся найти последнюю закрывающ��ю скобку
+                last_brace = raw.rfind('}')
+                if last_brace > len(raw) * 0.8:  # Если скобка не слишком близко к началу
+                    raw = raw[:last_brace + 1]
             # Парсим JSON
+            try:
+                return json.loads(raw)
+            except json.JSONDecodeError as e:
+                # Если это не JSON, пробуем найти JSON внутри строки
+                # Ищем первую { и последнюю }
+                start_idx = raw.find('{')
+                end_idx = raw.rfind('}')
+                if start_idx >= 0 and end_idx > start_idx:
+                    json_part = raw[start_idx:end_idx + 1]
+                    try:
+                        return json.loads(json_part)
+                    except:
+                        pass
+                # Если всё равно не получается, это ошибка для JSON-агентов
+                if not raw.startswith('{') and not raw.startswith('['):
+                    raise ValueError(f"Expected JSON but got plain text (first 200 chars): {raw[:200]}")
+                raise ValueError(f"JSON decode error: {e}. Raw (first 500 chars): {raw[:500]}")
         except Exception as e:
             last_error = e
+            print(f"[{agent.name}] Attempt {attempt}/{max_retries} failed: {e}")
     raise ValueError(
         f"[{agent.name}] Failed after {max_retries} attempts.\nLast error: {last_error}"