Spaces:

srishtirai
/

sql-query-generator

Runtime error

srishtirai commited on Mar 13, 2025

Commit

df181e8

verified ·

1 Parent(s): 55215ba

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -6,6 +6,15 @@ import os
 from transformers import AutoTokenizer, AutoModelForCausalLM
 from peft import PeftModel, PeftConfig
 # ✅ Ensure offload directory exists
 os.makedirs("offload", exist_ok=True)
@@ -26,7 +35,8 @@ def load_model(model_path):
         base_model_name,
         torch_dtype=torch.float16,  # Use FP16 to reduce memory usage
         device_map="auto",  # Automatically distribute across CPU/GPU
-        offload_folder="offload"  # ✅ Prevents memory crashes
     )
     # ✅ Load LoRA adapter with `is_trainable=False`

 from transformers import AutoTokenizer, AutoModelForCausalLM
 from peft import PeftModel, PeftConfig
+# ✅ Retrieve Hugging Face token from environment variable (Secret)
+HF_TOKEN = os.getenv("HF_TOKEN")  # ✅ Now using stored secret, not hardcoded!
+if HF_TOKEN is None:
+    raise ValueError("❌ ERROR: Hugging Face token is missing! Please set HF_TOKEN in Hugging Face Secrets.")
+# ✅ Authenticate with Hugging Face
+login(token=HF_TOKEN)
 # ✅ Ensure offload directory exists
 os.makedirs("offload", exist_ok=True)
         base_model_name,
         torch_dtype=torch.float16,  # Use FP16 to reduce memory usage
         device_map="auto",  # Automatically distribute across CPU/GPU
+        offload_folder="offload",  # ✅ Prevents memory crashes
+        use_auth_token=HF_TOKEN  # ✅ Authenticate model loading
     )
     # ✅ Load LoRA adapter with `is_trainable=False`