Spaces:

NimrodDev
/

RAG_SPACE

Build error

NimrodDev commited on Nov 2, 2025

Commit

8c01a5d

1 Parent(s): 1945324

force local st_model folder (no internet, no cache)

Files changed (1) hide show

rag.py CHANGED Viewed

@@ -104,15 +104,18 @@ def get_texts() -> List[str]:
         return []
 ## ------------------------------------------------------------------
-# ------# ------------------------------------------------------------------
-# ------------------------------------------------------------------
 @lru_cache(maxsize=1)
 def get_vectorstore() -> FAISS:
     texts = get_texts()
-    # --- FINAL: load 384 KB model once into RAM (no cache, no disk) --------
     from sentence_transformers import SentenceTransformer
-    model = SentenceTransformer("all-MiniLM-L6-v2", device="cpu", cache_folder=None)
     from langchain.embeddings import SentenceTransformerEmbeddings
     embeddings = SentenceTransformerEmbeddings(model=model)
     # ------------------------------------------------------------------------
@@ -123,7 +126,6 @@ def get_vectorstore() -> FAISS:
     splitter = RecursiveCharacterTextSplitter(chunk_size=600, chunk_overlap=50)
     docs = splitter.create_documents(texts, metadatas=[{"source": DATASET}] * len(texts))
     return FAISS.from_documents(docs, embeddings)
 # ------------------------------------------------------------------# LLM
 # ------------------------------------------------------------------
 @lru_cache(maxsize=1)

         return []
 ## ------------------------------------------------------------------
+# ------# --------# ------------------------------------------------------------------
 @lru_cache(maxsize=1)
 def get_vectorstore() -> FAISS:
     texts = get_texts()
+    # --- FINAL: load model from repo folder (no internet, no cache) --------
+    import os
+    local_model_path = os.path.join(os.path.dirname(__file__), "st_model")
     from sentence_transformers import SentenceTransformer
+    model = SentenceTransformer(local_model_path, device="cpu", cache_folder=None)
     from langchain.embeddings import SentenceTransformerEmbeddings
     embeddings = SentenceTransformerEmbeddings(model=model)
     # ------------------------------------------------------------------------
     splitter = RecursiveCharacterTextSplitter(chunk_size=600, chunk_overlap=50)
     docs = splitter.create_documents(texts, metadatas=[{"source": DATASET}] * len(texts))
     return FAISS.from_documents(docs, embeddings)
 # ------------------------------------------------------------------# LLM
 # ------------------------------------------------------------------
 @lru_cache(maxsize=1)