chaima01
/

wizard-pilgrims-finetuned

Text Generation

Model card Files Files and versions

chaima01 commited on May 12, 2025

Commit

214729c

·

verified ·

1 Parent(s): 9bdf998

correct the output format

Files changed (1) hide show

handler.py +9 -7

handler.py CHANGED Viewed

@@ -1,4 +1,4 @@
-from typing import Dict, Any
 from transformers import AutoModelForCausalLM, AutoTokenizer, TextGenerationPipeline
 import torch
@@ -6,30 +6,32 @@ class EndpointHandler:
     def __init__(self, path=""):
         # Load model and tokenizer
         self.tokenizer = AutoTokenizer.from_pretrained(path)
-        self.model = AutoModelForCausalLM.from_pretrained(path)
         self.pipeline = TextGenerationPipeline(
             model=self.model,
             tokenizer=self.tokenizer,
             device=0 if torch.cuda.is_available() else -1
         )
-    def __call__(self, data: Dict[str, Any]) -> Dict[str, Any]:
         prompt_input = data.get("inputs", "")
         vibe = data.get("vibe", "Open to All Paths")  # Default fallback
-        # Construct Camino-aware prompt with tone and identity
         full_prompt = (
             f"#### Human (Vibe: {vibe}): {prompt_input.strip()}\n"
             f"#### Assistant (Vela - your Camino companion):"
         )
-        # Default generation params, override if provided
         generation_args = data.get("parameters", {})
         generation_args.setdefault("max_new_tokens", 1024)
         generation_args.setdefault("temperature", 0.2)
         generation_args.setdefault("top_p", 0.95)
         generation_args.setdefault("do_sample", True)
-        # Run generation
         outputs = self.pipeline(full_prompt, **generation_args)
-        return {"generated_text": outputs[0]["generated_text"]}

+from typing import Dict, Any, List
 from transformers import AutoModelForCausalLM, AutoTokenizer, TextGenerationPipeline
 import torch
     def __init__(self, path=""):
         # Load model and tokenizer
         self.tokenizer = AutoTokenizer.from_pretrained(path)
+        self.model = AutoModelForCausalLM.from_pretrained(path, device_map="auto", torch_dtype=torch.float16)
         self.pipeline = TextGenerationPipeline(
             model=self.model,
             tokenizer=self.tokenizer,
             device=0 if torch.cuda.is_available() else -1
         )
+    def __call__(self, data: Dict[str, Any]) -> List[Dict[str, str]]:
         prompt_input = data.get("inputs", "")
         vibe = data.get("vibe", "Open to All Paths")  # Default fallback
+        # Construct Camino-aware prompt
         full_prompt = (
             f"#### Human (Vibe: {vibe}): {prompt_input.strip()}\n"
             f"#### Assistant (Vela - your Camino companion):"
         )
+        # Default generation params
         generation_args = data.get("parameters", {})
         generation_args.setdefault("max_new_tokens", 1024)
         generation_args.setdefault("temperature", 0.2)
         generation_args.setdefault("top_p", 0.95)
         generation_args.setdefault("do_sample", True)
+        # Generate response
         outputs = self.pipeline(full_prompt, **generation_args)
+        # Return in correct format
+        return [{"generated_text": outputs[0]["generated_text"]}]