Spaces:

Trigger82
/

Work

Sleeping

Trigger82 commited on May 31, 2025

Commit

3a356d5

verified ·

1 Parent(s): 678f25d

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -16,7 +16,7 @@ def chat(query: str):
     GET /chat?query=Your+question
     Returns JSON: {"answer": "...model’s reply..."}
     """
-    prompt expected by Phi‐1.5 Instruct
     prompt = (
         "<|im_start|>system\nYou are a helpful assistant.<|im_end|>"
         "<|im_start|>user\n" + query + "<|im_end|>"
@@ -24,7 +24,7 @@ def chat(query: str):
     )
     inputs = tokenizer(prompt, return_tensors="pt")
     outputs = model.generate(**inputs, max_new_tokens=200)
-    # Only decode newly generated tokens (skip the “prompt” tokens)
     response = tokenizer.decode(
         outputs[0][inputs.input_ids.shape[-1]:],
         skip_special_tokens=True

     GET /chat?query=Your+question
     Returns JSON: {"answer": "...model’s reply..."}
     """
     prompt = (
         "<|im_start|>system\nYou are a helpful assistant.<|im_end|>"
         "<|im_start|>user\n" + query + "<|im_end|>"
     )
     inputs = tokenizer(prompt, return_tensors="pt")
     outputs = model.generate(**inputs, max_new_tokens=200)
     response = tokenizer.decode(
         outputs[0][inputs.input_ids.shape[-1]:],
         skip_special_tokens=True