Spaces:

Loren
/

api_search_articles

Sleeping

Loren commited on Nov 16

Commit

f2cc8b2

verified ·

1 Parent(s): 61e3813

Upload database.py

Files changed (1) hide show

database.py CHANGED Viewed

@@ -21,6 +21,9 @@ from dotenv import load_dotenv
 import pyarrow as pa
 import pyarrow.compute as pc
 # Initialisations
 load_dotenv()
 HF_TOKEN = os.getenv('API_HF_TOKEN')
@@ -212,7 +215,8 @@ def fetch_query_results(query: str, k_model: int = 10,
         df["distance"] = df["faiss_id"].map(distance_map)
         if use_rerank:
-            print("use_rerank = True")
             # Cross-encoder
             df["chunk_text"] = df["chunk_text"].str.replace(r'\s+', ' ', regex=True).str.strip()
             top_passages = df["chunk_text"].tolist()
@@ -226,9 +230,10 @@ def fetch_query_results(query: str, k_model: int = 10,
             # Garder top k_cross
             df_top = df.head(k_cross)
         else:
-            print("use_rerank = False")
             df = df.sort_values(by="distance", ascending=False)
-            df["cross_score"] = None
             # Garder top k_model
             df_top = df.head(k_model)

 import pyarrow as pa
 import pyarrow.compute as pc
+import logging
+logging.basicConfig(level=logging.DEBUG)
 # Initialisations
 load_dotenv()
 HF_TOKEN = os.getenv('API_HF_TOKEN')
         df["distance"] = df["faiss_id"].map(distance_map)
         if use_rerank:
+            print("use_rerank = True", flush=True)
+            logging.debug("use_rerank = True")
             # Cross-encoder
             df["chunk_text"] = df["chunk_text"].str.replace(r'\s+', ' ', regex=True).str.strip()
             top_passages = df["chunk_text"].tolist()
             # Garder top k_cross
             df_top = df.head(k_cross)
         else:
+            print("use_rerank = False", flush=True)
+            logging.debug("use_rerank = False")
             df = df.sort_values(by="distance", ascending=False)
+            df["cross_score"] = df["distance"]
             # Garder top k_model
             df_top = df.head(k_model)