Spaces:

fahmiaziz
/

api-embedding

Running

App Files Files Community

fahmiaziz98 commited on Nov 2

Commit

9e5acab

1 Parent(s): fb8f5fc

init

Browse files

Files changed (2) hide show

src/api/routers/rerank.py +2 -22
src/models/embeddings/rank.py +0 -6

src/api/routers/rerank.py CHANGED Viewed

@@ -62,11 +62,8 @@ async def rerank_documents(
         )
     try:
-        # Extract kwargs but exclude rerank-specific fields
         kwargs = extract_embedding_kwargs(request)
-        # Remove fields that are already passed as positional arguments
-        # to avoid "got multiple values for argument" error
         kwargs.pop("query", None)
         kwargs.pop("documents", None)
         kwargs.pop("top_k", None)
@@ -80,19 +77,10 @@ async def rerank_documents(
                 detail=f"Model '{request.model_id}' is not a rerank model. Type: {config.type}",
             )
-        # Debug logs BEFORE calling rank_document
-        logger.debug(f"Rerank request - Query: '{request.query}'")
-        logger.debug(f"Documents to rank: {len(valid_docs)}")
-        if valid_docs:
-            logger.debug(f"First document: {valid_docs[0][1][:100]}...")
-        logger.debug(f"Top K: {request.top_k}")
         start = time.time()
-        # Extract documents for ranking
         documents_list = [doc for _, doc in valid_docs]
-        # Call rank_document - returns only top_k results
         ranking_results = model.rank_document(
             query=request.query,
             documents=documents_list,
@@ -102,18 +90,10 @@ async def rerank_documents(
         processing_time = time.time() - start
-        # Debug logs AFTER rank_document
-        logger.debug(f"Ranking returned {len(ranking_results)} results")
-        if ranking_results:
-            logger.debug(f"Top result score: {ranking_results[0]}")
-        # Build results from ranking_results
-        # ranking_results already contains top_k items with scores
         results = []
         for rank_result in ranking_results:
-            # Get original index from valid_docs
-            doc_idx = rank_result.get('corpus_id', 0)  # Index in filtered list
             if doc_idx < len(valid_docs):
                 original_idx = valid_docs[doc_idx][0]  # Original index
                 doc_text = documents_list[doc_idx]

         )
     try:
         kwargs = extract_embedding_kwargs(request)
         kwargs.pop("query", None)
         kwargs.pop("documents", None)
         kwargs.pop("top_k", None)
                 detail=f"Model '{request.model_id}' is not a rerank model. Type: {config.type}",
             )
         start = time.time()
         documents_list = [doc for _, doc in valid_docs]
         ranking_results = model.rank_document(
             query=request.query,
             documents=documents_list,
         processing_time = time.time() - start
         results = []
         for rank_result in ranking_results:
+            doc_idx = rank_result.get('corpus_id', 0)
             if doc_idx < len(valid_docs):
                 original_idx = valid_docs[doc_idx][0]  # Original index
                 doc_text = documents_list[doc_idx]

src/models/embeddings/rank.py CHANGED Viewed

@@ -115,8 +115,6 @@ class RerankModel:
             self.load()
         try:
-            # model.rank returns List[Dict] with 'corpus_id' and 'score'
-            # Already sorted by score (highest first) and limited to top_k
             ranking_results = self.model.rank(
                 query,
                 documents,
@@ -157,14 +155,11 @@ class RerankModel:
         if not rankings:
             return []
-        # Extract raw scores
         raw_scores = [ranking["score"] for ranking in rankings]
-        # Min-Max normalization
         min_score = min(raw_scores)
         max_score = max(raw_scores)
-        # If all scores are the same, return max target value
         if max_score == min_score:
             return [
                 {
@@ -174,7 +169,6 @@ class RerankModel:
                 for r in rankings
             ]
-        # Normalize to target range
         target_min, target_max = target_range
         normalized_rankings = []

             self.load()
         try:
             ranking_results = self.model.rank(
                 query,
                 documents,
         if not rankings:
             return []
         raw_scores = [ranking["score"] for ranking in rankings]
         min_score = min(raw_scores)
         max_score = max(raw_scores)
         if max_score == min_score:
             return [
                 {
                 for r in rankings
             ]
         target_min, target_max = target_range
         normalized_rankings = []