KevinKeller
/

cognitive-trainer-scripts

KevinKeller commited on Dec 27, 2025

Commit

116c7be

verified ·

1 Parent(s): ddc6839

Upload train_question_generator.py with huggingface_hub

Files changed (1) hide show

train_question_generator.py CHANGED Viewed

@@ -57,7 +57,7 @@ peft_config = LoraConfig(
     task_type="CAUSAL_LM",
 )
-# Training config - fewer epochs due to larger dataset
 training_args = SFTConfig(
     output_dir="./question-generator-output",
     num_train_epochs=2,
@@ -73,8 +73,6 @@ training_args = SFTConfig(
     push_to_hub=True,
     hub_model_id="KevinKeller/cognitive-question-generator-qwen2.5-7b",
     report_to="none",
-    max_seq_length=8192,
-    gradient_checkpointing=True,
 )
 print("Starting training...")
@@ -85,6 +83,7 @@ trainer = SFTTrainer(
     peft_config=peft_config,
     tokenizer=tokenizer,
     args=training_args,
 )
 trainer.train()

     task_type="CAUSAL_LM",
 )
+# Training config - removed max_seq_length, gradient_checkpointing from SFTConfig
 training_args = SFTConfig(
     output_dir="./question-generator-output",
     num_train_epochs=2,
     push_to_hub=True,
     hub_model_id="KevinKeller/cognitive-question-generator-qwen2.5-7b",
     report_to="none",
 )
 print("Starting training...")
     peft_config=peft_config,
     tokenizer=tokenizer,
     args=training_args,
+    max_seq_length=8192,  # Moved here
 )
 trainer.train()