Spaces:

Aragoner
/

rag_project

Sleeping

App Files Files Community

Aragoner commited on Feb 21, 2024

Commit

b3c39b6

verified ·

1 Parent(s): bed9663

Update backend/semantic_search.py

Browse files

Files changed (1) hide show

backend/semantic_search.py +10 -24

backend/semantic_search.py CHANGED Viewed

@@ -1,12 +1,9 @@
 import lancedb
-import os
 import gradio as gr
 from sentence_transformers import SentenceTransformer
 from transformers import AutoTokenizer, AutoModelForSequenceClassification
 import torch
-import time
 import os
-from pathlib import Path
 db = lancedb.connect(".lancedb")
@@ -19,39 +16,28 @@ CROSS_ENCODER = os.getenv("CROSS_ENCODER")
 retriever = SentenceTransformer(os.getenv("EMB_MODEL"))
 cross_encoder = AutoModelForSequenceClassification.from_pretrained(CROSS_ENCODER)
 cross_encoder.eval()
 cross_encoder_tokenizer = AutoTokenizer.from_pretrained(CROSS_ENCODER)
-def rerank(query, documents, k):
-    """Use cross-encoder to rerank documents retrieved from the retriever."""
-    tokens = cross_encoder_tokenizer([query] * len(documents), documents, padding=True, truncation=True, return_tensors="pt")
     with torch.no_grad():
-        logits = cross_encoder(**tokens).logits
-    scores = logits.reshape(-1).tolist()
-    documents = sorted(zip(documents, scores), key=lambda x: x[1], reverse=True)
-    return [doc[0] for doc in documents[:k]]
-# def retrieve(query, k):
-#     query_vec = retriever.encode(query)
-#     try:
-#         documents = TABLE.search(query_vec, vector_column_name=VECTOR_COLUMN).limit(k).to_list()
-#         documents = [doc[TEXT_COLUMN] for doc in documents]
-#
-#         return documents
-#
-#     except Exception as e:
-#         raise gr.Error(str(e))
-def retrieve(query, top_k_retriever=25, use_reranking=True, top_k_reranker=5):
     query_vec = retriever.encode(query)
     try:
         documents = TABLE.search(query_vec, vector_column_name=VECTOR_COLUMN).limit(top_k_retriever).to_list()
         documents = [doc[TEXT_COLUMN] for doc in documents]
         if use_reranking:
-            documents = rerank(query, documents, top_k_reranker)
         return documents

 import lancedb
 import gradio as gr
 from sentence_transformers import SentenceTransformer
 from transformers import AutoTokenizer, AutoModelForSequenceClassification
 import torch
 import os
 db = lancedb.connect(".lancedb")
 retriever = SentenceTransformer(os.getenv("EMB_MODEL"))
 cross_encoder = AutoModelForSequenceClassification.from_pretrained(CROSS_ENCODER)
 cross_encoder.eval()
 cross_encoder_tokenizer = AutoTokenizer.from_pretrained(CROSS_ENCODER)
+def reranking(query, list_of_documents, k):
+    received_tokens = cross_encoder_tokenizer([query] * len(list_of_documents), list_of_documents, padding=True, truncation=True, return_tensors="pt")
     with torch.no_grad():
+        logits_on_tokens = cross_encoder(**received_tokens).logits
+    probabilities = logits_on_tokens.reshape(-1).tolist()
+    documents = sorted(zip(list_of_documents, probabilities), key=lambda x: x[1], reverse=True)
+    result = [document[0] for document in documents[:k]]
+    return result
+def retrieve(query, top_k_retriever=30, use_reranking=True, top_k_reranker=5):
     query_vec = retriever.encode(query)
     try:
         documents = TABLE.search(query_vec, vector_column_name=VECTOR_COLUMN).limit(top_k_retriever).to_list()
         documents = [doc[TEXT_COLUMN] for doc in documents]
         if use_reranking:
+            documents = reranking(query, documents, top_k_reranker)
         return documents