Spaces:

Sandei
/

tech-support-helpdesk-chatbot

Sleeping

App Files Files Community

Sandei commited on 30 days ago

Commit

fa8d3c4

1 Parent(s): b907dad

relevant update

Browse files

Files changed (1) hide show

service/rag_service.py +35 -32

service/rag_service.py CHANGED Viewed

@@ -1,62 +1,63 @@
-import pickle
-from pathlib import Path
 from service.data_loader_service import CSVDataLoader
 from service.embedded_service import EmbeddingService
 from service.vector_store_service import VectorStoreService
 from service.llm_service import LLMService
-# -----------------------------
-# Constants / Cache
-# -----------------------------
-CACHE_PATH = Path("embeddings.pkl")
-CSV_FILE = "final_data_set(in).csv"  # your QA CSV file
-# -----------------------------
-# Initialize services
-# -----------------------------
 embedder = EmbeddingService()
 llm = LLMService()
 # Load documents
-loader = CSVDataLoader(CSV_FILE)
-documents = loader.load_qa_pairs()  # ["Q: ...\nA: ...", ...]
 # Load or compute embeddings
-if CACHE_PATH.exists():
-    with CACHE_PATH.open("rb") as f:
         embeddings = pickle.load(f)
 else:
     embeddings = embedder.embed(documents)
-    with CACHE_PATH.open("wb") as f:
         pickle.dump(embeddings, f)
 vector_store = VectorStoreService(embeddings, documents)
-# -----------------------------
-# Generate Answer Function
-# -----------------------------
-def generate_answer(question: str, k: int = 3) -> str:
     """
-    Generate an answer strictly from context.
-    If the answer is not present, return the context instead of making up a solution.
     """
     query_vec = embedder.embed([question])[0]
-    top_docs = vector_store.search(query_vec, k=k)
-    # Deduplicate context
-    seen = set()
-    unique_docs = []
-    for doc in top_docs:
-        if doc not in seen:
-            seen.add(doc)
-            unique_docs.append(doc)
-    context_text = "\n\n".join(unique_docs)
-    # Build clear, strict prompt
     prompt = f"""
 You are a helpful IT support assistant.
@@ -73,4 +74,6 @@ User question: {question}
 Answer:
 <|assistant|>
 """
     return llm.generate(prompt)

 from service.data_loader_service import CSVDataLoader
 from service.embedded_service import EmbeddingService
 from service.vector_store_service import VectorStoreService
 from service.llm_service import LLMService
+from pathlib import Path
+import pickle
+# -------------------------------
+# Setup
+# -------------------------------
+CACHE = Path("embeddings.pkl")
+# Embedder and LLM
 embedder = EmbeddingService()
 llm = LLMService()
 # Load documents
+loader = CSVDataLoader("final_data_set(in).csv")
+documents = loader.load_qa_pairs()
 # Load or compute embeddings
+if CACHE.exists():
+    with CACHE.open("rb") as f:
         embeddings = pickle.load(f)
 else:
     embeddings = embedder.embed(documents)
+    with CACHE.open("wb") as f:
         pickle.dump(embeddings, f)
 vector_store = VectorStoreService(embeddings, documents)
+# -------------------------------
+# Generate answer function
+# -------------------------------
+def generate_answer(question: str, k: int = 3, min_similarity: float = 0.65) -> str:
     """
+    Generates answer using RAG (retrieval + LLM).
+    Only includes context with similarity above threshold.
+    Returns fallback if no relevant context.
     """
+    # Compute embedding for the question
     query_vec = embedder.embed([question])[0]
+    # Get top-k results with scores
+    results = vector_store.search_with_scores(query_vec, k=k)  # returns list of (doc, score)
+    # Filter by similarity threshold
+    top_docs = [doc for doc, score in results if score >= min_similarity]
+    if not top_docs:
+        # No relevant context found
+        return "I’m sorry, I don’t have relevant information in my knowledge base for this query."
+    # Join context for the prompt
+    context_text = "\n\n".join(top_docs)
+    # Build prompt for TinyLlama
     prompt = f"""
 You are a helpful IT support assistant.
 Answer:
 <|assistant|>
 """
+    # Generate answer
     return llm.generate(prompt)