Spaces:

Prajith04
/

customer-support

Sleeping

App Files Files Community

Prajith04 commited on Apr 19

Commit

e169b07

verified ·

1 Parent(s): 84eb5da

Update vectordb_utils.py

Browse files

Files changed (1) hide show

vectordb_utils.py +24 -2

vectordb_utils.py CHANGED Viewed

@@ -3,20 +3,27 @@
 from qdrant_client import QdrantClient
 from qdrant_client.models import VectorParams, Distance, PointStruct
 from sentence_transformers import SentenceTransformer
 import uuid
 import os
-cache_dir = os.environ.get("MODEL_CACHE_DIR", "/app/cache")  # Fallback to /app/cache
 os.makedirs(cache_dir, exist_ok=True)
-encoder =SentenceTransformer("all-MiniLM-L6-v2", cache_folder=cache_dir)
 qdrant = QdrantClient(":memory:")
 collection_name = "customer_support_docsv1"
 def init_qdrant_collection():
     qdrant.recreate_collection(
         collection_name=collection_name,
         vectors_config=VectorParams(size=384, distance=Distance.COSINE)
     )
 def add_to_vectordb(query, response):
     vector = encoder.encode(query).tolist()
     qdrant.upload_points(
@@ -28,6 +35,21 @@ def add_to_vectordb(query, response):
         )]
     )
 def search_vectordb(query, limit=3):
     vector = encoder.encode(query).tolist()
     return qdrant.search(collection_name=collection_name, query_vector=vector, limit=limit)

 from qdrant_client import QdrantClient
 from qdrant_client.models import VectorParams, Distance, PointStruct
 from sentence_transformers import SentenceTransformer
+from datasets import load_dataset
 import uuid
 import os
+# Setup cache dir
+cache_dir = os.environ.get("MODEL_CACHE_DIR", "/app/cache")  # Fallback
 os.makedirs(cache_dir, exist_ok=True)
+# Encoder and Qdrant config
+encoder = SentenceTransformer("all-MiniLM-L6-v2", cache_folder=cache_dir)
 qdrant = QdrantClient(":memory:")
 collection_name = "customer_support_docsv1"
+# Initialize collection
 def init_qdrant_collection():
     qdrant.recreate_collection(
         collection_name=collection_name,
         vectors_config=VectorParams(size=384, distance=Distance.COSINE)
     )
+# Add a query/response to DB
 def add_to_vectordb(query, response):
     vector = encoder.encode(query).tolist()
     qdrant.upload_points(
         )]
     )
+# Search DB
 def search_vectordb(query, limit=3):
     vector = encoder.encode(query).tolist()
     return qdrant.search(collection_name=collection_name, query_vector=vector, limit=limit)
+# 🆕 Load and populate from Hugging Face dataset
+def populate_vectordb_from_hf():
+    print("Loading dataset from Hugging Face...")
+    dataset = load_dataset("Talhat/Customer_IT_Support", split="train")
+    print("Populating vector DB...")
+    for item in dataset:
+        query = item.get("input", "").strip()
+        response = item.get("output", "").strip()
+        if query and response:
+            add_to_vectordb(query, response)
+    print("Vector DB population complete.")