Spaces:

Dropdead072
/

CourseBuilder

Sleeping

App Files Files Community

Dropdead072 commited on Apr 9

Commit

fd8cb04

verified ·

1 Parent(s): 4bc15ad

Update pipeline.py

Browse files

Files changed (1) hide show

pipeline.py +34 -14

pipeline.py CHANGED Viewed

@@ -225,20 +225,36 @@ def check_completeness(state: GraphState):
     with log_step("check_completeness"):
         state["iteration"] += 1
-        context_text = "\n\n".join(doc.page_content for doc in state["contexts"])[:6000]
         prompt = f"""
-Запрос пользователя: {state['query']}
-Текущий контекст имеет {len(state['contexts'])} документов.
-Проанализируй, достаточно ли материала для создания полноценного курса как по запросу пользователя.
-Верни JSON:
 {{
-  "enough": true или false,
-  "next_query": "если не enough — один хороший поисковый запрос, иначе пустая строка"
 }}
 """
         raw = llm_analyze(prompt)
@@ -248,23 +264,27 @@ def check_completeness(state: GraphState):
             data = json.loads(match.group(0)) if match else json.loads(raw)
             enough = data.get("enough", False)
-            next_query = data.get("next_query", "").strip()
-            print(f"Enough: {enough}")
-            if next_query:
-                print(f"→ New query: {next_query}")
-            if not enough and next_query and state["iteration"] < 4:
                 return {
                     "retrieval_queries": state["retrieval_queries"] + [next_query],
                     "recurse": True
                 }
             else:
                 return {"recurse": False}
         except Exception as e:
-            print(f"Parse error in check_completeness: {e}")
-            return {"recurse": False}
 def generate_weekly_plan(state: GraphState):

     with log_step("check_completeness"):
         state["iteration"] += 1
+        total_chars = sum(len(doc.page_content) for doc in state["contexts"])
+        num_docs = len(state["contexts"])
+        print(f"Iteration {state['iteration']} | Documents: {num_docs} | Chars: ~{total_chars//1000}k")
+        # Жёсткий лимит по размеру контекста
+        if total_chars > 25000 or state["iteration"] >= 8:
+            print("✅ Достаточно контекста по объёму → завершаем сбор")
+            return {"recurse": False}
+        context_preview = "\n\n".join([doc.page_content[:400] for doc in state["contexts"][-8:]])
         prompt = f"""
+Текущий запрос пользователя:
+{state['query']}
+Уже собрано {num_docs} документов (~{total_chars//1000}k символов).
+Проанализируй, достаточно ли материала, чтобы создать **качественный интенсивный курс**.
+Ответь строго JSON:
 {{
+  "enough": true/false,
+  "reason": "короткое объяснение почему enough или нет",
+  "next_query": "если enough=false — один **конкретный** поисковый запрос для RAG.
+                 Должен быть тематическим, а не 'составь план'.
+                 Пример: 'аффинные алгебраические многообразия определение свойства примеры'"
 }}
+Будь строгим. Если контекста уже много и основные темы покрыты — ставь enough: true.
 """
         raw = llm_analyze(prompt)
             data = json.loads(match.group(0)) if match else json.loads(raw)
             enough = data.get("enough", False)
+            next_query = (data.get("next_query") or "").strip()
+            reason = data.get("reason", "")
+            print(f"Enough: {enough} | Reason: {reason[:100]}...")
+            if not enough and next_query and state["iteration"] < 8:
+                print(f"→ New query: {next_query}")
                 return {
                     "retrieval_queries": state["retrieval_queries"] + [next_query],
                     "recurse": True
                 }
             else:
+                print("✅ Завершаем итерации, переходим к генерации плана")
                 return {"recurse": False}
         except Exception as e:
+            print(f"Parse error: {e}")
+            # Если модель совсем не дала JSON — выходим после 6 итераций
+            if state["iteration"] >= 6:
+                return {"recurse": False}
+            return {"recurse": True}   # попробуем ещё раз
 def generate_weekly_plan(state: GraphState):