Spaces:

ayush2917
/

support-system

Runtime error

ayush2917 commited on May 2, 2025

Commit

34fbe97

verified ·

1 Parent(s): 58c35ab

Update src/retrieval.py

Files changed (1) hide show

src/retrieval.py CHANGED Viewed

@@ -1,29 +1,23 @@
-import numpy as np
 from sentence_transformers import SentenceTransformer
 import json
-import os
-from typing import List, Dict
 class DocumentRetriever:
     def __init__(self, model_name='all-MiniLM-L6-v2'):
         self.model = SentenceTransformer(model_name)
         self.documents = self._load_documents()
         self.doc_embeddings = self._embed_documents()
-    def _load_documents(self) -> List[Dict]:
         with open('data/rupeia_document.json', 'r') as f:
             return json.load(f)
-    def _embed_documents(self) -> np.ndarray:
         texts = [doc['content'] for doc in self.documents]
         return self.model.encode(texts)
-    def retrieve(self, query: str, top_k: int = 3) -> List[Dict]:
         query_embedding = self.model.encode(query)
         scores = np.dot(self.doc_embeddings, query_embedding)
         top_indices = np.argsort(scores)[-top_k:][::-1]
-        return [self.documents[i] for i in top_indices]
-def retrieve_relevant_documents(query: str) -> List[Dict]:
-    retriever = DocumentRetriever()
-    return retriever.retrieve(query)

 from sentence_transformers import SentenceTransformer
+import numpy as np
 import json
 class DocumentRetriever:
     def __init__(self, model_name='all-MiniLM-L6-v2'):
         self.model = SentenceTransformer(model_name)
         self.documents = self._load_documents()
         self.doc_embeddings = self._embed_documents()
+    def _load_documents(self):
         with open('data/rupeia_document.json', 'r') as f:
             return json.load(f)
+    def _embed_documents(self):
         texts = [doc['content'] for doc in self.documents]
         return self.model.encode(texts)
+    def retrieve(self, query: str, top_k: int = 3):
         query_embedding = self.model.encode(query)
         scores = np.dot(self.doc_embeddings, query_embedding)
         top_indices = np.argsort(scores)[-top_k:][::-1]
+        return [self.documents[i] for i in top_indices]