TheStageAI
/

Elastic-Llama-3.2-1B-Instruct

Text Generation

text2text-generation

Model card Files Files and versions

psynote123 commited on Apr 17, 2025

Commit

11ad7e0

·

verified ·

1 Parent(s): 3baf786

Update README.md

Files changed (1) hide show

README.md +16 -1

README.md CHANGED Viewed

@@ -65,7 +65,22 @@ model.generation_config.pad_token_id = tokenizer.eos_token_id
 # Inference simple as transformers library
 prompt = "Describe basics of DNNs quantization."
-inputs = tokenizer(prompt, return_tensors="pt")
 inputs.to(device)
 with torch.inference_mode:

 # Inference simple as transformers library
 prompt = "Describe basics of DNNs quantization."
+messages = [
+                {
+                    "role": "system",
+                    "content": "You are a search bot, answer on user text queries."
+                },
+                {
+                    "role": "user",
+                    "content": prompt
+                }
+            ]
+chat_prompt = tokenizer.apply_chat_template(
+    messages, add_generation_prompt=True, tokenize=False
+)
+inputs = tokenizer(chat_prompt, return_tensors="pt")
 inputs.to(device)
 with torch.inference_mode: