Spaces:

lightita
/

seallm-khm-sum

Sleeping

lightita commited on 21 days ago

Commit

15236b2

verified ·

1 Parent(s): 3628aa5

Update train_seallm_khm_sum.py

Files changed (1) hide show

train_seallm_khm_sum.py CHANGED Viewed

@@ -5,8 +5,9 @@ from transformers import (
     AutoTokenizer,
     AutoModelForCausalLM,
     BitsAndBytesConfig,
 )
-from trl import SFTTrainer, SFTConfig
 from peft import LoraConfig
 MODEL_NAME = "SeaLLMs/SeaLLMs-v3-1.5B"
@@ -101,8 +102,8 @@ def main():
         task_type="CAUSAL_LM",
     )
-    # NOTE: no max_seq_length here
-    sft_config = SFTConfig(
         output_dir="seallm-khm-sum-lora",
         num_train_epochs=2,
         per_device_train_batch_size=2,
@@ -110,16 +111,14 @@ def main():
         gradient_accumulation_steps=8,
         learning_rate=2e-4,
         logging_steps=10,
-        evaluation_strategy="steps",  # <- was eval_strategy
         eval_steps=200,
         save_steps=200,
         save_total_limit=2,
-        packing=True,
         lr_scheduler_type="cosine",
         warmup_ratio=0.03,
-        bf16=True,
-        gradient_checkpointing=True,
-        report_to="none",  # or "wandb"
     )
     trainer = SFTTrainer(
@@ -128,9 +127,10 @@ def main():
         train_dataset=train_ds,
         eval_dataset=eval_ds,
         peft_config=lora_config,
-        args=sft_config,
         dataset_text_field="text",
-        max_seq_length=1024,  # <- moved here
     )
     trainer.train()

     AutoTokenizer,
     AutoModelForCausalLM,
     BitsAndBytesConfig,
+    TrainingArguments,
 )
+from trl import SFTTrainer
 from peft import LoraConfig
 MODEL_NAME = "SeaLLMs/SeaLLMs-v3-1.5B"
         task_type="CAUSAL_LM",
     )
+    # Use standard TrainingArguments instead of SFTConfig
+    training_args = TrainingArguments(
         output_dir="seallm-khm-sum-lora",
         num_train_epochs=2,
         per_device_train_batch_size=2,
         gradient_accumulation_steps=8,
         learning_rate=2e-4,
         logging_steps=10,
+        evaluation_strategy="steps",  # eval every eval_steps
         eval_steps=200,
         save_steps=200,
         save_total_limit=2,
         lr_scheduler_type="cosine",
         warmup_ratio=0.03,
+        bf16=True,              # ok on modern GPUs; set False if it crashes
+        report_to="none",       # or "wandb"
     )
     trainer = SFTTrainer(
         train_dataset=train_ds,
         eval_dataset=eval_ds,
         peft_config=lora_config,
+        args=training_args,
         dataset_text_field="text",
+        max_seq_length=1024,    # set here instead of in config
+        # packing=False,        # keep off for compatibility
     )
     trainer.train()