codys12
/

Mistral-7b-Pathway-128k-3

Model card Files Files and versions

codys12 commited on Nov 17, 2023

Commit

1deae37

·

1 Parent(s): 97a48a0

Upload handler.py

Files changed (1) hide show

handler.py +5 -0

handler.py CHANGED Viewed

@@ -16,6 +16,7 @@ class EndpointHandler():
         config = PeftConfig.from_pretrained(path)
         model = AutoModelForCausalLM.from_pretrained(config.base_model_name_or_path, load_in_8bit=True, trust_remote_code=True, device_map='auto')
         self.tokenizer = AutoTokenizer.from_pretrained(config.base_model_name_or_path)
         # Load the Lora model
         self.model = PeftModel.from_pretrained(model, path)
@@ -44,6 +45,8 @@ class EndpointHandler():
         # Call the generate function
         output = generate(
             message=message,
             chat_history=chat_history,
             system_prompt=system_prompt,
@@ -63,6 +66,8 @@ class EndpointHandler():
         return {"generated_text": prediction}
 def generate(
     message: str,
     chat_history: list[tuple[str, str]],
     system_prompt: str = None,

         config = PeftConfig.from_pretrained(path)
         model = AutoModelForCausalLM.from_pretrained(config.base_model_name_or_path, load_in_8bit=True, trust_remote_code=True, device_map='auto')
         self.tokenizer = AutoTokenizer.from_pretrained(config.base_model_name_or_path)
+        self.tokenizer.chat_template = "{% for message in messages %}{% if message['role'] == 'user' %}{{ bos_token + '[INST] ' + message['content'] + ' [/INST]' }}{% elif message['role'] == 'system' %}{{ bos_token + '<<SYS>>\\n' + message['content'] + '\\n<</SYS>>\\n\\n' }}{% elif message['role'] == 'assistant' %}{{ ' '  + message['content'] + ' ' + eos_token }}{% endif %}{% endfor %}"
         # Load the Lora model
         self.model = PeftModel.from_pretrained(model, path)
         # Call the generate function
         output = generate(
+            tokenizer=tokenizer,
+            model=model,
             message=message,
             chat_history=chat_history,
             system_prompt=system_prompt,
         return {"generated_text": prediction}
 def generate(
+    tokenizer,
+    model,
     message: str,
     chat_history: list[tuple[str, str]],
     system_prompt: str = None,