Spaces:

EphAsad
/

FireSymptom

Sleeping

App Files Files Community

EphAsad commited on Jan 27

Commit

820c2fc

verified ·

1 Parent(s): a3b2ab5

Update embed_index.py

Browse files

Files changed (1) hide show

embed_index.py +26 -9

embed_index.py CHANGED Viewed

@@ -2,13 +2,24 @@ import json
 import os
 import faiss
 import numpy as np
-from sentence_transformers import SentenceTransformer
-from config.settings import *
 CONDITIONS_DIR = "Conditions"
-INDEX_DIR = "index"
 def load_chunks():
     texts = []
     metadatas = []
@@ -28,23 +39,29 @@ def load_chunks():
         for chunk in chunks:
             texts.append(chunk["text"])
             metadatas.append({
-                "condition": chunk["condition"],
-                "section": chunk["section"],
-                "source_id": chunk["source_id"]
             })
     return texts, metadatas
 def main():
-    print("Loading embedding model...")
     model = SentenceTransformer(EMBEDDING_MODEL)
     texts, metadatas = load_chunks()
     print(f"Loaded {len(texts)} chunks")
     embeddings = model.encode(texts, show_progress_bar=True)
-    embeddings = np.array(embeddings).astype("float32")
     index = faiss.IndexFlatL2(embeddings.shape[1])
     index.add(embeddings)
@@ -56,7 +73,7 @@ def main():
     with open(METADATA_PATH, "w", encoding="utf-8") as f:
         json.dump(metadatas, f, indent=2)
-    print("FAISS index built successfully")
 if __name__ == "__main__":

 import os
 import faiss
 import numpy as np
+# ---------- LOAD SETTINGS ----------
+def load_settings():
+    with open("config/settings.json", "r", encoding="utf-8") as f:
+        return json.load(f)
+SETTINGS = load_settings()
+EMBEDDING_MODEL = SETTINGS["embedding_model"]
+FAISS_INDEX_PATH = SETTINGS["faiss_index_path"]
+METADATA_PATH = SETTINGS["metadata_path"]
 CONDITIONS_DIR = "Conditions"
+INDEX_DIR = os.path.dirname(FAISS_INDEX_PATH)
+# ---------- LOAD CHUNKS ----------
 def load_chunks():
     texts = []
     metadatas = []
         for chunk in chunks:
             texts.append(chunk["text"])
             metadatas.append({
+                "condition": chunk.get("condition"),
+                "section": chunk.get("section"),
+                "source_id": chunk.get("source_id")
             })
     return texts, metadatas
+# ---------- BUILD INDEX ----------
 def main():
+    print("🔨 Building FAISS index...")
+    from sentence_transformers import SentenceTransformer
     model = SentenceTransformer(EMBEDDING_MODEL)
     texts, metadatas = load_chunks()
+    if not texts:
+        raise RuntimeError("No chunks found. Ensure Conditions/*/chunks.json exists.")
     print(f"Loaded {len(texts)} chunks")
     embeddings = model.encode(texts, show_progress_bar=True)
+    embeddings = np.asarray(embeddings, dtype="float32")
     index = faiss.IndexFlatL2(embeddings.shape[1])
     index.add(embeddings)
     with open(METADATA_PATH, "w", encoding="utf-8") as f:
         json.dump(metadatas, f, indent=2)
+    print("✅ FAISS index built successfully")
 if __name__ == "__main__":