Spaces:

warleagle
/

Medical_Chat_Autocompletion

Runtime error

warleagle commited on Jan 25, 2024

Commit

92ca8d9

verified ·

1 Parent(s): 34306e9

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -9,7 +9,7 @@ MODEL_NAME = "warleagle/medical_chat_saiga"
 config = PeftConfig.from_pretrained(MODEL_NAME)
 model = AutoModelForCausalLM.from_pretrained(
     config.base_model_name_or_path,
-    load_in_4bit=True,
     torch_dtype=torch.float16,
     device_map="auto"
 )
@@ -42,7 +42,7 @@ def predict(input_data, temp):
     conversation = Conversation()
     conversation.add_user_message(input_data)
-    prompt = conversation.get_prompt(tokenizer)
     output = generate(model, tokenizer, prompt, generation_config)
     return output

 config = PeftConfig.from_pretrained(MODEL_NAME)
 model = AutoModelForCausalLM.from_pretrained(
     config.base_model_name_or_path,
+    load_in_8bit=True,
     torch_dtype=torch.float16,
     device_map="auto"
 )
     conversation = Conversation()
     conversation.add_user_message(input_data)
+    prompt = conversation.get_prompt()
     output = generate(model, tokenizer, prompt, generation_config)
     return output