lokegud
/

infrastructure-training-scripts

lokegud commited on about 1 month ago

Commit

95a8e8a

verified ·

1 Parent(s): 8b5d3dc

Upload train_infrastructure_model.py with huggingface_hub

Files changed (1) hide show

train_infrastructure_model.py CHANGED Viewed

@@ -112,6 +112,7 @@ training_args = SFTConfig(
     per_device_eval_batch_size=4,
     gradient_accumulation_steps=4,
     gradient_checkpointing=True,
     # Optimization
     learning_rate=2e-4,
@@ -145,6 +146,8 @@ training_args = SFTConfig(
     # Misc
     seed=42,
 )
 # Initialize trainer
@@ -155,9 +158,6 @@ trainer = SFTTrainer(
     eval_dataset=eval_dataset,
     peft_config=peft_config,
     args=training_args,
-    max_seq_length=2048,
-    dataset_text_field="text",
-    packing=False,
 )
 # Train

     per_device_eval_batch_size=4,
     gradient_accumulation_steps=4,
     gradient_checkpointing=True,
+    max_seq_length=2048,
     # Optimization
     learning_rate=2e-4,
     # Misc
     seed=42,
+    dataset_text_field="text",
+    packing=False,
 )
 # Initialize trainer
     eval_dataset=eval_dataset,
     peft_config=peft_config,
     args=training_args,
 )
 # Train