stmasson
/

training-scripts

stmasson commited on Dec 28, 2025

Commit

ab21097

verified ·

1 Parent(s): 6da594c

Upload scripts/train_alizee_v2_stage1_sft.py with huggingface_hub

Files changed (1) hide show

scripts/train_alizee_v2_stage1_sft.py CHANGED Viewed

@@ -311,7 +311,6 @@ training_config = SFTConfig(
     # Memory-efficient tokenization (reduce parallel processes to save RAM)
     dataset_num_proc=1,  # Single process to avoid OOM during tokenization
-    dataset_batch_size=100,  # Smaller batches during tokenization
 )
 # Initialize trainer

     # Memory-efficient tokenization (reduce parallel processes to save RAM)
     dataset_num_proc=1,  # Single process to avoid OOM during tokenization
 )
 # Initialize trainer