Spaces:

CiLprototype
/

Cortex-in-the-Loop

Sleeping

GirishaBuilds01 commited on Feb 14

Commit

60fe91b

verified ·

1 Parent(s): 15d573f

Update core/model_loader.py

Files changed (1) hide show

core/model_loader.py CHANGED Viewed

@@ -3,19 +3,19 @@ from transformers import AutoModelForCausalLM, AutoTokenizer
 SUPPORTED_MODELS = {
     "DistilGPT2 (Fast CPU)": "distilgpt2",
-    "TinyLlama (Better LLM)": "TinyLlama/TinyLlama-1.1B-Chat-v1.0",
-    "Phi-2 (Research Heavy)": "microsoft/phi-2"
 }
 def load_model(model_key):
     model_name = SUPPORTED_MODELS[model_key]
     tokenizer = AutoTokenizer.from_pretrained(model_name)
     model = AutoModelForCausalLM.from_pretrained(
         model_name,
-        torch_dtype=torch.float32,
-        device_map="cpu"
     )
     model.eval()
     return model, tokenizer

 SUPPORTED_MODELS = {
     "DistilGPT2 (Fast CPU)": "distilgpt2",
 }
 def load_model(model_key):
     model_name = SUPPORTED_MODELS[model_key]
     tokenizer = AutoTokenizer.from_pretrained(model_name)
     model = AutoModelForCausalLM.from_pretrained(
         model_name,
+        dtype=torch.float32   # ✅ Use dtype instead of torch_dtype
     )
+    model.to("cpu")  # ✅ Explicit CPU move
     model.eval()
     return model, tokenizer