Spaces:

SecureLLMSys
/

AttnTrace

Sleeping

SecureLLMSys commited on Aug 3

Commit

1ca09f6

1 Parent(s): 444ccdb

update

Files changed (1) hide show

src/models/Llama.py CHANGED Viewed

@@ -24,15 +24,15 @@ class Llama(Model):
         ]
     def _load_model_if_needed(self):
-        if self._model is None:
             model = AutoModelForCausalLM.from_pretrained(
                 self.name,
                 torch_dtype=torch.bfloat16,
                 token=self.hf_token,
                 device_map="auto",  # or omit entirely to default to CPU
             )
-            self._model = model
-        return self._model
     def query(self, msg, max_tokens=128000):
         model = self._load_model_if_needed().to("cuda")

         ]
     def _load_model_if_needed(self):
+        if self.model is None:
             model = AutoModelForCausalLM.from_pretrained(
                 self.name,
                 torch_dtype=torch.bfloat16,
                 token=self.hf_token,
                 device_map="auto",  # or omit entirely to default to CPU
             )
+            self.model = model
+        return self.model
     def query(self, msg, max_tokens=128000):
         model = self._load_model_if_needed().to("cuda")