Spaces:

emya
/

SteveJobs-Chat

Runtime error

emya commited on Nov 13, 2023

Commit

2f9c1ea

1 Parent(s): 8ad2f92

use base and new models

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,8 +1,20 @@
 import gradio as gr
-from transformers import pipeline
-pipe = pipeline("translation", model="emya/vicuna-7b-v1.5-steve-jobs-8bit-v1")
 def predict(text):
     prompt = f"{text} (Answer in a few sentences)"

 import gradio as gr
+from transformers import AutoModelForCausalLM, pipeline
+model_name = "lmsys/vicuna-7b-v1.5"
+base_model = AutoModelForCausalLM.from_pretrained(
+    model_name,
+    low_cpu_mem_usage=True,
+    return_dict=True,
+    #torch_dtype=torch.float16,
+    device_map="auto",
+    load_in_8bit=True,
+)
+new_model = "emya/vicuna-7b-v1.5-steve-jobs-8bit-v1"
+model = PeftModel.from_pretrained(base_model, new_model, load_in_8bit=True)
+pipe = pipeline("translation", model=model)
 def predict(text):
     prompt = f"{text} (Answer in a few sentences)"