Spaces:

AlekMan
/

HSE_AI

Sleeping

AlekMan commited on Jun 16, 2025

Commit

c18f087

verified ·

1 Parent(s): a19143d

Update llm_trainer.py

Files changed (1) hide show

llm_trainer.py CHANGED Viewed

@@ -7,7 +7,8 @@ class LLMTrainer:
                  model: torch.nn.Module = None,
                  tokenizer: PreTrainedTokenizer | AutoTokenizer = None,
                  model_returns_logits: bool = False):
-        self.device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
         if tokenizer is None:
             tokenizer = AutoTokenizer.from_pretrained("gpt2")
@@ -31,7 +32,7 @@ class LLMTrainer:
         with torch.no_grad():
             while generated_tokens.size(1) < length:
-                with torch.autocast(device_type=self.device, dtype=torch.bfloat16):
                     if self.model_returns_logits:
                         logits = self.model(generated_tokens)
                     else:

                  model: torch.nn.Module = None,
                  tokenizer: PreTrainedTokenizer | AutoTokenizer = None,
                  model_returns_logits: bool = False):
+        self.device_type = "cuda" if torch.cuda.is_available() else "cpu"
+        self.device = torch.device(self.device_type)
         if tokenizer is None:
             tokenizer = AutoTokenizer.from_pretrained("gpt2")
         with torch.no_grad():
             while generated_tokens.size(1) < length:
+                with torch.autocast(device_type=self.device_type, dtype=torch.bfloat16):
                     if self.model_returns_logits:
                         logits = self.model(generated_tokens)
                     else: