Spaces:

Prajjwalng
/

customercare

Running

Prajjwalng commited on Mar 15, 2025

Commit

fe6193d

verified ·

1 Parent(s): 53cc210

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -22,7 +22,7 @@ adapter_id = "Prajjwalng/gemma_customercare_adapters" #adapter model
 # Initialize model and tokenizer (load only once)
 @st.cache_resource
-def load_model(model_id, adapter_id):
     base_model = AutoModelForCausalLM.from_pretrained(
         model_id,
         low_cpu_mem_usage=True,
@@ -31,9 +31,9 @@ def load_model(model_id, adapter_id):
         device_map={"": 0} if torch.cuda.is_available() else "cpu"
     )
-    merged_model = PeftModel.from_pretrained(base_model, adapter_id)
     tokenizer = AutoTokenizer.from_pretrained(model_id, add_eos_token=True)
-    return merged_model, tokenizer
 merged_model, tokenizer = load_model(model_id, adapter_id)

 # Initialize model and tokenizer (load only once)
 @st.cache_resource
+def load_model(model_id):
     base_model = AutoModelForCausalLM.from_pretrained(
         model_id,
         low_cpu_mem_usage=True,
         device_map={"": 0} if torch.cuda.is_available() else "cpu"
     )
+    #merged_model = PeftModel.from_pretrained(base_model, adapter_id)
     tokenizer = AutoTokenizer.from_pretrained(model_id, add_eos_token=True)
+    return base_model, tokenizer
 merged_model, tokenizer = load_model(model_id, adapter_id)