Spaces:

minhvtt
/

ChatbotRAG

Runtime error

minhvtt commited on Nov 22, 2025

Commit

1009897

verified ·

1 Parent(s): ca36499

Update advanced_rag.py

Files changed (1) hide show

advanced_rag.py CHANGED Viewed

@@ -187,20 +187,25 @@ Alternative queries (one per line):"""
         # Get Cross-Encoder scores
         ce_scores = self.cross_encoder.predict(pairs)
-        # Create reranked documents with new scores
         reranked = []
-        for doc, ce_score in zip(documents, ce_scores):
-            # Combine CE score with original confidence (weighted)
-            combined_score = 0.7 * float(ce_score) + 0.3 * doc.confidence
             reranked.append(RetrievedDocument(
                 id=doc.id,
                 text=doc.text,
-                confidence=float(combined_score),
                 metadata=doc.metadata
             ))
-        # Sort by new combined score
         reranked.sort(key=lambda x: x.confidence, reverse=True)
         return reranked[:top_k]

         # Get Cross-Encoder scores
         ce_scores = self.cross_encoder.predict(pairs)
+        # Normalize CE scores using sigmoid (convert logits to 0-1 range)
+        import math
+        def sigmoid(x):
+            return 1 / (1 + math.exp(-x))
+        ce_scores_normalized = [sigmoid(float(score)) for score in ce_scores]
+        # Create reranked documents with normalized scores
         reranked = []
+        for doc, ce_score_norm in zip(documents, ce_scores_normalized):
+            # Use ONLY Cross-Encoder score (it's more accurate than cosine similarity)
             reranked.append(RetrievedDocument(
                 id=doc.id,
                 text=doc.text,
+                confidence=float(ce_score_norm),
                 metadata=doc.metadata
             ))
+        # Sort by Cross-Encoder score
         reranked.sort(key=lambda x: x.confidence, reverse=True)
         return reranked[:top_k]