Spaces:

jatingocodeo
/

phi2-assistant-demo

Sleeping

jatingocodeo commited on Mar 12, 2025

Commit

ee3c970

verified ·

1 Parent(s): ae3435b

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,16 +1,22 @@
 import gradio as gr
 import torch
 from transformers import AutoModelForCausalLM, AutoTokenizer
 # Load model and tokenizer
 def load_model(model_id):
     tokenizer = AutoTokenizer.from_pretrained(model_id, trust_remote_code=True)
-    model = AutoModelForCausalLM.from_pretrained(
-        model_id,
         torch_dtype=torch.float16,
         device_map="auto",
         trust_remote_code=True
     )
     return model, tokenizer
 def generate_response(instruction, model, tokenizer, max_length=200, temperature=0.7, top_p=0.9):
@@ -39,10 +45,7 @@ def generate_response(instruction, model, tokenizer, max_length=200, temperature
         return response_parts[1].strip()
     return response.strip()
-def create_demo():
-    # Use your uploaded model
-    model_id = "jatingocodeo/phi2-finetuned-openassistant"
     # Load model and tokenizer
     model, tokenizer = load_model(model_id)
@@ -106,5 +109,7 @@ def create_demo():
     return demo
 if __name__ == "__main__":
-    demo = create_demo()
     demo.launch()

 import gradio as gr
 import torch
 from transformers import AutoModelForCausalLM, AutoTokenizer
+from peft import PeftModel
 # Load model and tokenizer
 def load_model(model_id):
+    # First load the base model
+    base_model_id = "microsoft/phi-2"
     tokenizer = AutoTokenizer.from_pretrained(model_id, trust_remote_code=True)
+    base_model = AutoModelForCausalLM.from_pretrained(
+        base_model_id,
         torch_dtype=torch.float16,
         device_map="auto",
         trust_remote_code=True
     )
+    # Load and merge the LoRA adapter
+    model = PeftModel.from_pretrained(base_model, model_id)
     return model, tokenizer
 def generate_response(instruction, model, tokenizer, max_length=200, temperature=0.7, top_p=0.9):
         return response_parts[1].strip()
     return response.strip()
+def create_demo(model_id):
     # Load model and tokenizer
     model, tokenizer = load_model(model_id)
     return demo
 if __name__ == "__main__":
+    # Replace with your model ID (username/model-name)
+    model_id = "your-username/phi2-finetuned-oasst"
+    demo = create_demo(model_id)
     demo.launch()