Spaces:

XQ
/

Dokumentassistent

Sleeping

App Files Files

XQ commited on Apr 6

Commit

4ba88df

1 Parent(s): ec64993

Update router logic

Browse files

Files changed (2) hide show

src/agent/router.py +90 -11
tests/test_router.py +61 -2

src/agent/router.py CHANGED Viewed

@@ -15,6 +15,11 @@ from src.retrieval.reranker import Reranker
 logger = logging.getLogger(__name__)
 class RouterState(TypedDict):
     """LangGraph state passed between routing nodes.
@@ -31,6 +36,7 @@ class RouterState(TypedDict):
         fused_results: Results after RRF fusion.
         reranked: Results after cross-encoder reranking.
         confidence: Max reranker score (0.0-1.0).
         answer: Final generated answer.
     """
@@ -45,6 +51,7 @@ class RouterState(TypedDict):
     fused_results: list[QueryResult]
     reranked: list[QueryResult]
     confidence: float
     answer: str
@@ -70,6 +77,7 @@ def _make_initial_state(query: str, top_k: int) -> RouterState:
         fused_results=[],
         reranked=[],
         confidence=0.0,
         answer="",
     )
@@ -274,6 +282,53 @@ class QueryRouter:
             logger.info("Confidence: %.4f (sigmoid-normalized by reranker)", confidence)
         return {"reranked": reranked, "confidence": confidence}
     @staticmethod
     def _update_intent_node(state: RouterState) -> dict:
         """Promote FACTUAL to RAG when sources are found."""
@@ -295,19 +350,28 @@ class QueryRouter:
     @staticmethod
     def _should_retrieve(state: RouterState) -> str:
-        """Skip retrieval when intent is UNKNOWN."""
-        return "retrieve" if state["intent"] != IntentType.UNKNOWN else "rerank"
     def _build_graph(self) -> object:
         """Build the LangGraph routing graph.
-        Nodes:
-            detect    → detect language and intent
-            translate → translate query to Danish if needed
-            retrieve  → hybrid search (skipped when intent is UNKNOWN)
-            rerank    → cross-encoder reranking
-            update_intent → promote FACTUAL to RAG when sources are found
-            generate  → build prompt and call LLM
         Returns:
             Compiled LangGraph graph.
@@ -317,18 +381,30 @@ class QueryRouter:
         graph.add_node("translate", self._translate_node)
         graph.add_node("retrieve", self._retrieve_node)
         graph.add_node("rerank", self._rerank_node)
         graph.add_node("update_intent", self._update_intent_node)
         graph.add_node("generate", self._generate_node)
         graph.set_entry_point("detect")
         graph.add_edge("detect", "translate")
         graph.add_conditional_edges(
             "translate",
             self._should_retrieve,
-            {"retrieve": "retrieve", "rerank": "rerank"},
         )
         graph.add_edge("retrieve", "rerank")
-        graph.add_edge("rerank", "update_intent")
         graph.add_edge("update_intent", "generate")
         graph.add_edge("generate", END)
@@ -461,6 +537,9 @@ class QueryRouter:
                 elif node_name == "rerank":
                     event["reranked_count"] = len(update.get("reranked", []))
                     event["confidence"] = round(update.get("confidence", 0.0), 4)
                 yield event

 logger = logging.getLogger(__name__)
+# Reranker confidence below this triggers a query-broadening retry.
+# Cross-encoder sigmoid scores below 0.3 generally indicate poor relevance.
+_LOW_CONFIDENCE_THRESHOLD = 0.3
+_MAX_RETRIES = 1
 class RouterState(TypedDict):
     """LangGraph state passed between routing nodes.
         fused_results: Results after RRF fusion.
         reranked: Results after cross-encoder reranking.
         confidence: Max reranker score (0.0-1.0).
+        retry_count: Number of query-broadening retries performed so far.
         answer: Final generated answer.
     """
     fused_results: list[QueryResult]
     reranked: list[QueryResult]
     confidence: float
+    retry_count: int
     answer: str
         fused_results=[],
         reranked=[],
         confidence=0.0,
+        retry_count=0,
         answer="",
     )
             logger.info("Confidence: %.4f (sigmoid-normalized by reranker)", confidence)
         return {"reranked": reranked, "confidence": confidence}
+    def _broaden_query_node(self, state: RouterState) -> dict:
+        """Rewrite the retrieval query when reranker confidence is low.
+        Uses the LLM to generate alternative search terms while preserving
+        the original meaning, then increments the retry counter.
+        """
+        prompt = (
+            "The following search query did not return good results from "
+            "the document database. Rewrite it to be broader or use "
+            "different keywords while keeping the same meaning. "
+            "Reply with ONLY the rewritten query, nothing else.\n\n"
+            f"Original question: {state['query']}\n"
+            f"Failed search query: {state['retrieval_query']}"
+        )
+        broadened = str(self._llm_chain.invoke(prompt)).strip()
+        logger.info(
+            "Broadened query for retry %d: %s",
+            state["retry_count"] + 1,
+            broadened,
+        )
+        return {
+            "retrieval_query": broadened,
+            "retry_count": state["retry_count"] + 1,
+        }
+    @staticmethod
+    def _check_confidence(state: RouterState) -> str:
+        """Decide whether to retry retrieval or proceed to generation.
+        Triggers a retry when results exist but confidence is below
+        the threshold and retries remain.  Empty results (no documents
+        matched at all) are not retried — broadening cannot help when
+        the knowledge base simply lacks coverage.
+        """
+        if (
+            state.get("reranked")
+            and state["confidence"] < _LOW_CONFIDENCE_THRESHOLD
+            and state["retry_count"] < _MAX_RETRIES
+        ):
+            logger.info(
+                "Low confidence (%.4f < %.2f), retrying with broadened query",
+                state["confidence"],
+                _LOW_CONFIDENCE_THRESHOLD,
+            )
+            return "retry"
+        return "accept"
     @staticmethod
     def _update_intent_node(state: RouterState) -> dict:
         """Promote FACTUAL to RAG when sources are found."""
     @staticmethod
     def _should_retrieve(state: RouterState) -> str:
+        """Skip retrieval entirely when intent is UNKNOWN."""
+        return "retrieve" if state["intent"] != IntentType.UNKNOWN else "generate"
     def _build_graph(self) -> object:
         """Build the LangGraph routing graph.
+        Graph topology::
+            detect → translate ─┬─ (UNKNOWN) ──────────────→ generate
+                                └─ (other)  → retrieve → rerank
+                                                 ↑          │
+                                                 │      check_confidence
+                                                 │        │       │
+                                              broaden ←─ retry  accept
+                                              _query        → update_intent
+                                                                  │
+                                                               generate
+        Key LangGraph features demonstrated:
+            - Conditional edges: intent-based skip, confidence-based routing
+            - Cycle: low-confidence retry loop (broaden_query → retrieve)
+            - Shared state: retry_count controls loop termination
         Returns:
             Compiled LangGraph graph.
         graph.add_node("translate", self._translate_node)
         graph.add_node("retrieve", self._retrieve_node)
         graph.add_node("rerank", self._rerank_node)
+        graph.add_node("broaden_query", self._broaden_query_node)
         graph.add_node("update_intent", self._update_intent_node)
         graph.add_node("generate", self._generate_node)
         graph.set_entry_point("detect")
         graph.add_edge("detect", "translate")
+        # Branch: skip retrieval entirely for off-topic queries
         graph.add_conditional_edges(
             "translate",
             self._should_retrieve,
+            {"retrieve": "retrieve", "generate": "generate"},
         )
         graph.add_edge("retrieve", "rerank")
+        # Branch + cycle: retry with broadened query on low confidence
+        graph.add_conditional_edges(
+            "rerank",
+            self._check_confidence,
+            {"retry": "broaden_query", "accept": "update_intent"},
+        )
+        graph.add_edge("broaden_query", "retrieve")  # ← the loop
         graph.add_edge("update_intent", "generate")
         graph.add_edge("generate", END)
                 elif node_name == "rerank":
                     event["reranked_count"] = len(update.get("reranked", []))
                     event["confidence"] = round(update.get("confidence", 0.0), 4)
+                elif node_name == "broaden_query":
+                    event["retrieval_query"] = update.get("retrieval_query", "")
+                    event["retry_count"] = update.get("retry_count", 0)
                 yield event

tests/test_router.py CHANGED Viewed

@@ -143,7 +143,6 @@ class TestQueryRouterDirect:
         """UNKNOWN intent skips retrieval and returns zero confidence."""
         classifier, retriever, reranker, llm_chain = mock_components
-        reranker.rerank.return_value = []
         _setup_llm_chain_danish(llm_chain, "Fallback answer", intent="unknown")
         router = QueryRouter(classifier, retriever, reranker, llm_chain)
@@ -153,6 +152,7 @@ class TestQueryRouterDirect:
         assert response.intent == IntentType.UNKNOWN
         assert response.confidence == 0.0
         retriever.search_detailed.assert_not_called()
     def test_unknown_intent_prompt_uses_generic_instruction(
         self, mock_components
@@ -160,7 +160,6 @@ class TestQueryRouterDirect:
         """UNKNOWN intent should use the generic helpful instruction."""
         classifier, retriever, reranker, llm_chain = mock_components
-        reranker.rerank.return_value = []
         _setup_llm_chain_danish(llm_chain, "answer", intent="unknown")
         router = QueryRouter(classifier, retriever, reranker, llm_chain)
@@ -300,3 +299,63 @@ class TestSigmoidInReranker:
         response = router.route("test", top_k=3)
         assert response.confidence == pytest.approx(0.9, abs=1e-6)

         """UNKNOWN intent skips retrieval and returns zero confidence."""
         classifier, retriever, reranker, llm_chain = mock_components
         _setup_llm_chain_danish(llm_chain, "Fallback answer", intent="unknown")
         router = QueryRouter(classifier, retriever, reranker, llm_chain)
         assert response.intent == IntentType.UNKNOWN
         assert response.confidence == 0.0
         retriever.search_detailed.assert_not_called()
+        reranker.rerank.assert_not_called()
     def test_unknown_intent_prompt_uses_generic_instruction(
         self, mock_components
         """UNKNOWN intent should use the generic helpful instruction."""
         classifier, retriever, reranker, llm_chain = mock_components
         _setup_llm_chain_danish(llm_chain, "answer", intent="unknown")
         router = QueryRouter(classifier, retriever, reranker, llm_chain)
         response = router.route("test", top_k=3)
         assert response.confidence == pytest.approx(0.9, abs=1e-6)
+class TestLowConfidenceRetry:
+    """Tests for the query-broadening retry loop on low confidence."""
+    def test_low_confidence_triggers_retry(self, mock_components) -> None:
+        """When reranker returns low-confidence results, the query should be
+        broadened and retrieval retried once."""
+        classifier, retriever, reranker, llm_chain = mock_components
+        low_results = [_make_query_result("weak match", 0.15)]
+        good_results = [_make_query_result("strong match", 0.85)]
+        retriever.search_detailed.return_value = _make_hybrid_result(low_results)
+        # First rerank: low confidence → triggers retry
+        # Second rerank: high confidence → proceeds to generate
+        reranker.rerank.side_effect = [low_results, good_results]
+        # LLM calls: detect, broaden_query, generate
+        combined = "language: Danish\nintent: factual"
+        llm_chain.invoke.side_effect = [combined, "bredere søgning", "Final answer"]
+        router = QueryRouter(classifier, retriever, reranker, llm_chain)
+        response = router.route("snævert spørgsmål", top_k=3)
+        assert response.answer == "Final answer"
+        assert response.confidence == pytest.approx(0.85, abs=1e-6)
+        assert retriever.search_detailed.call_count == 2
+        assert reranker.rerank.call_count == 2
+    def test_empty_results_do_not_trigger_retry(self, mock_components) -> None:
+        """When reranker returns no results at all, retrying is skipped."""
+        classifier, retriever, reranker, llm_chain = mock_components
+        retriever.search_detailed.return_value = _make_hybrid_result([])
+        reranker.rerank.return_value = []
+        _setup_llm_chain_danish(llm_chain, "No information found", intent="factual")
+        router = QueryRouter(classifier, retriever, reranker, llm_chain)
+        response = router.route("asdfghjkl", top_k=3)
+        assert response.confidence == 0.0
+        assert retriever.search_detailed.call_count == 1
+        # Reranker still called once (with empty input, returns [])
+        assert reranker.rerank.call_count <= 1
+    def test_high_confidence_skips_retry(self, mock_components) -> None:
+        """When confidence is above threshold, no retry is attempted."""
+        classifier, retriever, reranker, llm_chain = mock_components
+        results = [_make_query_result("good match", 0.9)]
+        retriever.search_detailed.return_value = _make_hybrid_result(results)
+        reranker.rerank.return_value = results
+        _setup_llm_chain_danish(llm_chain, "answer", intent="factual")
+        router = QueryRouter(classifier, retriever, reranker, llm_chain)
+        router.route("test", top_k=3)
+        assert retriever.search_detailed.call_count == 1
+        assert reranker.rerank.call_count == 1