Spaces:

NimrodDev
/

RAG_SPACE

Build error

NimrodDev commited on Nov 2, 2025

Commit

22e1771

1 Parent(s): 2aa887d

force offline local MiniLM folder (no cache)

Files changed (1) hide show

rag.py CHANGED Viewed

@@ -103,15 +103,24 @@ def get_texts() -> List[str]:
         print(f"⚠ Dataset fetch failed: {e} – using empty corpus")
         return []
-# ------------------------------------------------------------------
 # ------------------------------------------------------------------
 @lru_cache(maxsize=1)
 def get_vectorstore() -> FAISS:
     texts = get_texts()
-    # --- FINAL: use pre-installed MiniLM (no cache, no internet) ----------
     from sentence_transformers import SentenceTransformer
-    model = SentenceTransformer("all-MiniLM-L6-v2", device="cpu", cache_folder=None)
     from langchain.embeddings import SentenceTransformerEmbeddings
     embeddings = SentenceTransformerEmbeddings(model=model)

         print(f"⚠ Dataset fetch failed: {e} – using empty corpus")
         return []
 # ------------------------------------------------------------------
 @lru_cache(maxsize=1)
 def get_vectorstore() -> FAISS:
     texts = get_texts()
+    # --- FINAL: load local MiniLM (no internet, no cache) -----------------
+    import os
+    local_model_path = os.path.abspath(
+        os.path.join(os.path.dirname(__file__), "st_model")
+    )
+    # force offline + local only
+    os.environ["TRANSFORMERS_OFFLINE"] = "1"
+    os.environ["HF_DATASETS_OFFLINE"] = "1"
+    os.environ["SENTENCE_TRANSFORMERS_HOME"] = local_model_path
     from sentence_transformers import SentenceTransformer
+    model = SentenceTransformer(local_model_path, device="cpu", cache_folder=None)
     from langchain.embeddings import SentenceTransformerEmbeddings
     embeddings = SentenceTransformerEmbeddings(model=model)