vignesh0007
/

Anime-Gen-Inference

Model card Files Files and versions

vignesh0007 commited on Apr 19, 2025

Commit

31c3b35

·

verified ·

1 Parent(s): 4c81d8f

Update handler.py

Files changed (1) hide show

handler.py +5 -3

handler.py CHANGED Viewed

@@ -8,11 +8,12 @@ token = os.getenv("HUGGINGFACE_HUB_TOKEN")
 class EndpointHandler:
     def __init__(self, path=""):
-        self.tokenizer = AutoTokenizer.from_pretrained("meta-llama/Llama-2-7b-hf")
         base_model = AutoModelForCausalLM.from_pretrained(
             "meta-llama/Llama-2-7b-hf",
             torch_dtype=torch.float16,
-            device_map="auto"
         )
         lora_config = LoraConfig(
@@ -28,7 +29,8 @@ class EndpointHandler:
         adapter_path = hf_hub_download(
             repo_id="vignesh0007/Anime-Gen-Llama-2-7B",
             filename="adapter_model.safetensors",
-            repo_type="model"
         )
         lora_state = load_file(adapter_path)
         self.model.load_state_dict(lora_state, strict=False)

 class EndpointHandler:
     def __init__(self, path=""):
+        self.tokenizer = AutoTokenizer.from_pretrained("meta-llama/Llama-2-7b-hf", token=token)
         base_model = AutoModelForCausalLM.from_pretrained(
             "meta-llama/Llama-2-7b-hf",
             torch_dtype=torch.float16,
+            device_map="auto",
+            token=token
         )
         lora_config = LoraConfig(
         adapter_path = hf_hub_download(
             repo_id="vignesh0007/Anime-Gen-Llama-2-7B",
             filename="adapter_model.safetensors",
+            repo_type="model",
+            token=token
         )
         lora_state = load_file(adapter_path)
         self.model.load_state_dict(lora_state, strict=False)