Spaces:

alexorlov
/

checklist-agent

Sleeping

App Files Files Community

alexorlov commited on 14 days ago

Commit

ef2fdd9

verified ·

1 Parent(s): de5fcc2

Upload app/services/llm.py with huggingface_hub

Browse files

Files changed (1) hide show

app/services/llm.py +46 -179

app/services/llm.py CHANGED Viewed

@@ -1,185 +1,52 @@
-from anthropic import Anthropic
-from typing import List, Dict, Any
-from app.config import get_settings
-from app.models.question import Answer
-from app.models.checklist import ChecklistItem
 import json
-import re
-def extract_json(text: str) -> dict:
-    """Извлекает JSON из текста, даже если он обернут в markdown code blocks"""
-    # Пробуем найти JSON в code blocks
-    json_match = re.search(r'```(?:json)?\s*([\s\S]*?)```', text)
-    if json_match:
-        text = json_match.group(1).strip()
-    # Пробуем найти JSON объект напрямую
-    json_match = re.search(r'\{[\s\S]*\}', text)
-    if json_match:
-        text = json_match.group(0)
-    return json.loads(text)
-class LLMService:
     def __init__(self):
-        settings = get_settings()
-        self.client = Anthropic(api_key=settings.anthropic_api_key)
-        self.model = "claude-haiku-4-5-20251001"
-    def generate_initial_questions(self) -> List[Dict[str, str]]:
-        """Генерирует первые 3 вопроса для начала интервью"""
-        response = self.client.messages.create(
-            model=self.model,
-            max_tokens=1024,
-            messages=[
-                {
-                    "role": "user",
-                    "content": """Ты - AI ассистент, который помогает заполнить чеклист созвона с клиентом.
-Сгенерируй 3 начальных вопроса для клиента, чтобы понять суть его проекта.
-Вопросы должны быть открытыми и направлены на выяснение:
-1. Общей информации о проекте
-2. Целей и задач
-3. Текущей ситуации
-Ответ верни в формате JSON:
-{
-    "questions": [
-        {"id": "q1", "text": "текст вопроса 1"},
-        {"id": "q2", "text": "текст вопроса 2"},
-        {"id": "q3", "text": "текст вопроса 3"}
-    ]
-}
-Только JSON, без дополнительного текста."""
-                }
-            ]
-        )
-        result = extract_json(response.content[0].text)
-        return result["questions"]
-    def analyze_round_and_generate_questions(
-        self,
-        round_number: int,
-        all_answers: List[Answer],
-        round_summaries: List[str]
-    ) -> Dict[str, Any]:
-        """Анализирует ответы раунда и генерирует следующие вопросы"""
-        answers_text = "\n".join([
-            f"Вопрос: {a.question_text}\nОтвет: {a.audio_transcript}"
-            for a in all_answers
-        ])
-        summaries_text = "\n".join([
-            f"Раунд {i+1}: {s}" for i, s in enumerate(round_summaries)
-        ]) if round_summaries else "Нет предыдущих саммари"
-        response = self.client.messages.create(
-            model=self.model,
-            max_tokens=2048,
-            messages=[
-                {
-                    "role": "user",
-                    "content": f"""Ты - AI ассистент для заполнения чеклиста созвона с клиентом.
-Текущий раунд: {round_number}
-Всего раундов: 3
-Предыдущие саммари:
-{summaries_text}
-Все ответы клиента:
-{answers_text}
-Задача:
-1. Создай краткое саммари текущего раунда (2-3 предложения)
-2. Если это не последний раунд (раунд < 3), сгенерируй 3 уточняющих вопроса на основе полученных ответов
-Ответ в формате JSON:
-{{
-    "round_summary": "краткое саммари раунда",
-    "questions": [
-        {{"id": "q{round_number*3+1}", "text": "вопрос 1"}},
-        {{"id": "q{round_number*3+2}", "text": "вопрос 2"}},
-        {{"id": "q{round_number*3+3}", "text": "вопрос 3"}}
-    ]
-}}
-Если это раунд 3, поле "questions" может быть пустым массивом.
-Только JSON, без дополнительного текста."""
-                }
-            ]
         )
-        return extract_json(response.content[0].text)
-    def generate_checklist(
-        self,
-        all_answers: List[Answer],
-        round_summaries: List[str]
-    ) -> Dict[str, Any]:
-        """Генерирует финальный чеклист на основе всех ответов"""
-        answers_text = "\n".join([
-            f"Вопрос: {a.question_text}\nОтвет: {a.audio_transcript}"
-            for a in all_answers
-        ])
-        summaries_text = "\n".join([
-            f"Раунд {i+1}: {s}" for i, s in enumerate(round_summaries)
-        ])
-        response = self.client.messages.create(
-            model=self.model,
-            max_tokens=4096,
-            messages=[
-                {
-                    "role": "user",
-                    "content": f"""Ты - AI ассистент для заполнения чеклиста созвона с клиентом.
-Саммари раундов:
-{summaries_text}
-Все ответы клиента:
-{answers_text}
-Создай структурированный чеклист созвона с клиентом.
-Ответ в формате JSON:
-{{
-    "checklist": [
-        {{
-            "category": "Общая информация",
-            "item": "описание пункта",
-            "status": "confirmed",
-            "notes": "дополнительные заметки или null"
-        }}
-    ]
-}}
-Статусы:
-- "confirmed" - информация получена и подтверждена
-- "needs_clarification" - требует уточнения
-- "not_discussed" - не обсуждалось
-Категории могут быть:
-- Общая информация
-- Цели и задачи
-- Сроки и бюджет
-- Технические требования
-- Дополнительные заметки
-Только JSON, без дополнительного текста."""
-                }
-            ]
-        )
-        return extract_json(response.content[0].text)
-def get_llm_service() -> LLMService:
-    return LLMService()

 import json
+import logging
+from google import genai
+from google.genai import types
+from app.config import settings
+logger = logging.getLogger(__name__)
+class GeminiService:
     def __init__(self):
+        self._client = None
+    def initialize(self):
+        if not settings.gemini_api_key:
+            logger.warning("GEMINI_API_KEY not set — LLM calls will fail")
+            return
+        self._client = genai.Client(api_key=settings.gemini_api_key)
+        logger.info(f"Gemini client initialized with model: {settings.gemini_model}")
+    async def generate(self, system_prompt: str, user_prompt: str) -> str:
+        if not self._client:
+            raise RuntimeError("Gemini client not initialized")
+        response = self._client.models.generate_content(
+            model=settings.gemini_model,
+            contents=[types.Content(role="user", parts=[types.Part(text=user_prompt)])],
+            config=types.GenerateContentConfig(
+                system_instruction=system_prompt,
+                thinking_config=types.ThinkingConfig(thinking_level="HIGH"),
+            ),
         )
+        # Extract text, skipping thinking parts
+        text_parts = []
+        for part in response.candidates[0].content.parts:
+            if part.text and not getattr(part, "thought", False):
+                text_parts.append(part.text)
+        return "\n".join(text_parts).strip()
+    async def generate_json(self, system_prompt: str, user_prompt: str) -> dict | list:
+        raw = await self.generate(system_prompt, user_prompt)
+        # Strip markdown code fences if present
+        cleaned = raw.strip()
+        if cleaned.startswith("```"):
+            lines = cleaned.split("\n")
+            # Remove first line (```json) and last line (```)
+            lines = [l for l in lines[1:] if l.strip() != "```"]
+            cleaned = "\n".join(lines)
+        return json.loads(cleaned)
+gemini_service = GeminiService()