sunkencity
/

training-scripts

sunkencity commited on Jan 17

Commit

29ee62e

verified ·

1 Parent(s): 3468e66

Upload train_survival.py with huggingface_hub

Files changed (1) hide show

train_survival.py CHANGED Viewed

@@ -44,6 +44,7 @@ peft_config = LoraConfig(
 )
 # Training Arguments
 training_args = SFTConfig(
     output_dir="./results",
     num_train_epochs=3,
@@ -54,8 +55,7 @@ training_args = SFTConfig(
     push_to_hub=True,
     hub_model_id=OUTPUT_MODEL_ID,
     fp16=True,
-    max_seq_length=1024,
-    dataset_text_field="text", # We need to format the data first if it's not in 'text'
     packing=False
 )
@@ -72,6 +72,7 @@ def formatting_prompts_func(example):
     return output_texts
 # Trainer
 trainer = SFTTrainer(
     model=model,
     train_dataset=dataset,
@@ -79,6 +80,7 @@ trainer = SFTTrainer(
     formatting_func=formatting_prompts_func,
     args=training_args,
     tokenizer=tokenizer,
 )
 print("Starting training...")
@@ -86,4 +88,4 @@ trainer.train()
 print("Pushing to hub...")
 trainer.push_to_hub()
-print("Done!")

 )
 # Training Arguments
+# Removed max_seq_length from SFTConfig as it caused a TypeError
 training_args = SFTConfig(
     output_dir="./results",
     num_train_epochs=3,
     push_to_hub=True,
     hub_model_id=OUTPUT_MODEL_ID,
     fp16=True,
+    dataset_text_field="text",
     packing=False
 )
     return output_texts
 # Trainer
+# max_seq_length is passed to SFTTrainer directly
 trainer = SFTTrainer(
     model=model,
     train_dataset=dataset,
     formatting_func=formatting_prompts_func,
     args=training_args,
     tokenizer=tokenizer,
+    max_seq_length=1024
 )
 print("Starting training...")
 print("Pushing to hub...")
 trainer.push_to_hub()
+print("Done!")