stmasson
/

training-scripts

stmasson commited on Dec 27, 2025

Commit

a8da371

verified ·

1 Parent(s): e8e5378

Upload scripts/train_alizee_v2_stage1_sft.py with huggingface_hub

Files changed (1) hide show

scripts/train_alizee_v2_stage1_sft.py CHANGED Viewed

@@ -71,10 +71,12 @@ print("\n📝 Loading tokenizer...")
 tokenizer = AutoTokenizer.from_pretrained(
     BASE_MODEL,
     trust_remote_code=True,
 )
 if tokenizer.pad_token is None:
     tokenizer.pad_token = tokenizer.eos_token
 tokenizer.padding_side = "right"
 # QLoRA quantization config
 print("\n⚙️ Configuring 4-bit quantization...")

 tokenizer = AutoTokenizer.from_pretrained(
     BASE_MODEL,
     trust_remote_code=True,
+    model_max_length=MAX_SEQ_LENGTH,  # Set max length to prevent overflow warnings
 )
 if tokenizer.pad_token is None:
     tokenizer.pad_token = tokenizer.eos_token
 tokenizer.padding_side = "right"
+tokenizer.truncation_side = "right"  # Truncate from the right for long sequences
 # QLoRA quantization config
 print("\n⚙️ Configuring 4-bit quantization...")