Spaces:

handaru2002
/

LLMRAG

Sleeping

handaru2002 commited on Jan 29

Commit

69aa234

verified ·

1 Parent(s): 6e6d001

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -30,13 +30,22 @@ TGT = "ind_Latn"
 LLM = "microsoft/phi-2"
 llm_tok = AutoTokenizer.from_pretrained(LLM)
 llm = AutoModelForCausalLM.from_pretrained(
     LLM,
-    torch_dtype=torch.float16 if device == "cuda" else torch.float32
 ).to(device)
 llm.eval()
 # ============================================================
 # KNOWLEDGE BASE
 # ============================================================

 LLM = "microsoft/phi-2"
+# 🔧 FIX WAJIB
+llm_tok.pad_token = llm_tok.eos_token
+llm_tok.pad_token_id = llm_tok.eos_token_id
 llm_tok = AutoTokenizer.from_pretrained(LLM)
 llm = AutoModelForCausalLM.from_pretrained(
     LLM,
+    torch_dtype=torch.float16 if device == "cuda" else torch.float32,
+    low_cpu_mem_usage=True
 ).to(device)
 llm.eval()
 # ============================================================
 # KNOWLEDGE BASE
 # ============================================================