stmasson
/

training-scripts

stmasson commited on Dec 26, 2025

Commit

39df74c

verified ·

1 Parent(s): 73c7a79

Upload scripts/train_alizee_v2_stage1_sft.py with huggingface_hub

Files changed (1) hide show

scripts/train_alizee_v2_stage1_sft.py CHANGED Viewed

@@ -270,7 +270,7 @@ training_config = SFTConfig(
     per_device_eval_batch_size=PER_DEVICE_BATCH,
     gradient_accumulation_steps=GRADIENT_ACCUMULATION,
     learning_rate=LEARNING_RATE,
-    max_seq_length=MAX_SEQ_LENGTH,
     # Optimization
     warmup_ratio=WARMUP_RATIO,

     per_device_eval_batch_size=PER_DEVICE_BATCH,
     gradient_accumulation_steps=GRADIENT_ACCUMULATION,
     learning_rate=LEARNING_RATE,
+    max_length=MAX_SEQ_LENGTH,  # TRL uses max_length, not max_seq_length
     # Optimization
     warmup_ratio=WARMUP_RATIO,