Spaces:

Shubham170793
/

enterprise-knowledge-assistant

Sleeping

Shubham170793 commited on Oct 2

Commit

93a72c6

verified ·

1 Parent(s): 641185f

Update src/qa.py

Files changed (1) hide show

src/qa.py CHANGED Viewed

@@ -5,14 +5,14 @@ from vectorstore import search_faiss
 print("✅ qa.py loaded from:", __file__)
-# Always redirect Hugging Face caches to /tmp
 CACHE_DIR = "/tmp/huggingface"
 os.environ["HF_HOME"] = CACHE_DIR
 os.environ["TRANSFORMERS_CACHE"] = CACHE_DIR
 os.environ["HF_DATASETS_CACHE"] = CACHE_DIR
 # ----------------------------
-# Embedding model for queries
 # ----------------------------
 _query_model = SentenceTransformer(
     "sentence-transformers/all-MiniLM-L6-v2",
@@ -23,25 +23,13 @@ _query_model = SentenceTransformer(
 # LLM for answers
 # ----------------------------
 MODEL_NAME = "google/flan-t5-small"
-MODEL_PATH = os.path.join(CACHE_DIR, MODEL_NAME)
-if not os.path.exists(MODEL_PATH):
-    print(f"⬇️ Downloading {MODEL_NAME} to {MODEL_PATH}")
-    _answer_model = pipeline(
-        "text2text-generation",
-        model=MODEL_NAME,
-        cache_dir=CACHE_DIR
-    )
-    # Save pipeline model locally
-    _answer_model.model.save_pretrained(MODEL_PATH)
-    _answer_model.tokenizer.save_pretrained(MODEL_PATH)
-else:
-    print(f"✅ Loading {MODEL_NAME} from {MODEL_PATH}")
-    _answer_model = pipeline(
-        "text2text-generation",
-        model=MODEL_PATH,
-        cache_dir=CACHE_DIR
-    )
 # ----------------------------
 # Functions

 print("✅ qa.py loaded from:", __file__)
+# Force Hugging Face to use /tmp for cache
 CACHE_DIR = "/tmp/huggingface"
 os.environ["HF_HOME"] = CACHE_DIR
 os.environ["TRANSFORMERS_CACHE"] = CACHE_DIR
 os.environ["HF_DATASETS_CACHE"] = CACHE_DIR
 # ----------------------------
+# Query embedding model
 # ----------------------------
 _query_model = SentenceTransformer(
     "sentence-transformers/all-MiniLM-L6-v2",
 # LLM for answers
 # ----------------------------
 MODEL_NAME = "google/flan-t5-small"
+# Make sure model downloads into /tmp
+_answer_model = pipeline(
+    "text2text-generation",
+    model=MODEL_NAME,
+    cache_dir=CACHE_DIR
+)
 # ----------------------------
 # Functions