Spaces:

Heng2004
/

Laos-Natural-Science-Chatbot

Running

App Files Files Community

Heng2004 commited on 2 days ago

Commit

405e720

verified ·

1 Parent(s): 11d64bd

Update loader.py

Browse files

Files changed (1) hide show

loader.py +45 -0

loader.py CHANGED Viewed

@@ -18,6 +18,51 @@ MANUAL_QA_PATH = os.path.join(DATA_DIR, "manual_qa.jsonl")
 GLOSSARY_PATH = os.path.join(DATA_DIR, "glossary.jsonl")
 def sync_upload_manual_qa() -> str:
     """

 GLOSSARY_PATH = os.path.join(DATA_DIR, "glossary.jsonl")
+# Add this new filename constant
+CACHE_FILENAME = "cached_embeddings.pt"
+CACHE_PATH = os.path.join(DATA_DIR, CACHE_FILENAME)
+def sync_upload_cache() -> str:
+    """Upload the cached_embeddings.pt to Hugging Face Dataset."""
+    if not DATASET_REPO_ID or "YOUR_USERNAME" in DATASET_REPO_ID:
+        return "⚠️ Upload Skipped (Repo ID not set)"
+    print(f"[INFO] Uploading {CACHE_FILENAME}...")
+    try:
+        from huggingface_hub import HfApi
+        api = HfApi()
+        api.upload_file(
+            path_or_fileobj=CACHE_PATH,
+            path_in_repo=CACHE_FILENAME,
+            repo_id=DATASET_REPO_ID,
+            repo_type="dataset",
+            commit_message="System: Updated embedding cache"
+        )
+        return "☁️ Cache Upload Success"
+    except Exception as e:
+        print(f"[ERROR] Upload cache failed: {e}")
+        return f"⚠️ Cache Upload Failed: {e}"
+def sync_download_cache() -> None:
+    """Download cached_embeddings.pt at startup."""
+    if not DATASET_REPO_ID:
+        return
+    print(f"[INFO] Downloading {CACHE_FILENAME}...")
+    try:
+        from huggingface_hub import hf_hub_download
+        import shutil
+        downloaded_path = hf_hub_download(
+            repo_id=DATASET_REPO_ID,
+            filename=CACHE_FILENAME,
+            repo_type="dataset",
+            token=os.environ.get("HF_TOKEN")
+        )
+        shutil.copy(downloaded_path, CACHE_PATH)
+        print("[INFO] Cache download success!")
+    except Exception as e:
+        print(f"[WARN] Could not download cache (First run?): {e}")
 def sync_upload_manual_qa() -> str:
     """