Spaces:

arasaltan
/

StudentHelper

Sleeping

arasaltan commited on 21 days ago

Commit

77f4af2

verified ·

1 Parent(s): 12f607d

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -11,17 +11,14 @@ tokenizer = AutoTokenizer.from_pretrained(BASE_MODEL)
 tokenizer.pad_token = tokenizer.eos_token
 # Base model (CPU)
-# 1. Base model (disk offload aktif)
 model = AutoModelForCausalLM.from_pretrained(
     BASE_MODEL,
     torch_dtype=torch.float32,
-    device_map="auto",
-    offload_dir="offload",
-    offload_state_dict=True,
     low_cpu_mem_usage=True
 )
-# 2. LoRA (RAM'de kalır)
 model = PeftModel.from_pretrained(model, LORA_PATH)
 model.eval()

 tokenizer.pad_token = tokenizer.eos_token
 # Base model (CPU)
 model = AutoModelForCausalLM.from_pretrained(
     BASE_MODEL,
     torch_dtype=torch.float32,
+    device_map={"": "cpu"},
     low_cpu_mem_usage=True
 )
+# Load LoRA
 model = PeftModel.from_pretrained(model, LORA_PATH)
 model.eval()