Spaces:

ivwhy
/

iris

Sleeping

Jimin Park commited on Dec 9, 2024

Commit

014e235

1 Parent(s): 6468a2a

updated req.txt and app.py

Files changed (2) hide show

app.py CHANGED Viewed

@@ -1,7 +1,24 @@
 from transformers import pipeline
 import gradio as gr
-chatbot = pipeline(model="ivwhy/lora_model")
 message_list = []
 response_list = []

 from transformers import pipeline
+from peft import PeftModel, PeftConfig
 import gradio as gr
+base_model = "unsloth/Llama-3.2-3B-Instruct"  # Replace with the correct base model
+peft_model_path = "ivwhy/lora_model"
+config = PeftConfig.from_pretrained(peft_model_path)
+model = AutoModelForCausalLM.from_pretrained(base_model, torch_dtype=torch.bfloat16)
+model = PeftModel.from_pretrained(model, peft_model_path)
+tokenizer = AutoTokenizer.from_pretrained(base_model)
+pipeline = transformers.pipeline(
+    "text-generation",
+    model=model,
+    tokenizer=tokenizer,
+    device=-1,  # CPU
+)
+chatbot = pipeline
 message_list = []
 response_list = []

requirements.txt CHANGED Viewed

@@ -1,3 +1,5 @@
 torch
 transformers
-gradio

 torch
 transformers
+gradio
+python-dotenv
+peft