Spaces:

AndreasVar
/

LitBench-UI

Runtime error

Andreas Varvarigos commited on Mar 11, 2025

Commit

cb37d55

verified ·

1 Parent(s): c71f098

Update src/train.py

Files changed (1) hide show

src/train.py CHANGED Viewed

@@ -6,7 +6,7 @@ import networkx as nx
 from tqdm import tqdm
 from peft import (LoraConfig, get_peft_model,
                   prepare_model_for_kbit_training)
-from transformers import AutoModelForCausalLM, AutoTokenizer, BitsAndBytesConfig
@@ -30,17 +30,11 @@ class QloraTrainer_CS:
         model_id = self.config['inference']["base_model"]
         print(model_id)
-        bnb_config = BitsAndBytesConfig(
-            load_in_8bit=True,
-            bnb_8bit_use_double_quant=True,
-            bnb_8bit_quant_type="nf8",
-            bnb_8bit_compute_dtype=torch.bfloat16
-        )
         tokenizer = AutoTokenizer.from_pretrained(model_id)
         tokenizer.model_max_length = self.config['training']['tokenizer']["max_length"]
         if not tokenizer.pad_token:
             tokenizer.pad_token = tokenizer.eos_token
-        model = AutoModelForCausalLM.from_pretrained(model_id, quantization_config=bnb_config, torch_dtype=torch.bfloat16)
         if model.device.type != 'cuda':
             model.to('cuda')

 from tqdm import tqdm
 from peft import (LoraConfig, get_peft_model,
                   prepare_model_for_kbit_training)
+from transformers import AutoModelForCausalLM, AutoTokenizer
         model_id = self.config['inference']["base_model"]
         print(model_id)
         tokenizer = AutoTokenizer.from_pretrained(model_id)
         tokenizer.model_max_length = self.config['training']['tokenizer']["max_length"]
         if not tokenizer.pad_token:
             tokenizer.pad_token = tokenizer.eos_token
+        model = AutoModelForCausalLM.from_pretrained(model_id, torch_dtype=torch.bfloat16)
         if model.device.type != 'cuda':
             model.to('cuda')