Spaces:

lightita
/

seallm-khm-sum

Sleeping

lightita commited on 21 days ago

Commit

fdfb5e5

verified ·

1 Parent(s): 15236b2

Update train_seallm_khm_sum.py

Files changed (1) hide show

train_seallm_khm_sum.py CHANGED Viewed

@@ -111,16 +111,16 @@ def main():
         gradient_accumulation_steps=8,
         learning_rate=2e-4,
         logging_steps=10,
-        evaluation_strategy="steps",  # eval every eval_steps
-        eval_steps=200,
         save_steps=200,
         save_total_limit=2,
         lr_scheduler_type="cosine",
         warmup_ratio=0.03,
-        bf16=True,              # ok on modern GPUs; set False if it crashes
-        report_to="none",       # or "wandb"
     )
     trainer = SFTTrainer(
         model=model,
         tokenizer=tokenizer,

         gradient_accumulation_steps=8,
         learning_rate=2e-4,
         logging_steps=10,
         save_steps=200,
         save_total_limit=2,
         lr_scheduler_type="cosine",
         warmup_ratio=0.03,
+        # old transformers may not support bf16, so let's be safe:
+        fp16=True,          # use fp16 instead of bf16
+        report_to="none",   # if this errors next, we’ll drop it
     )
     trainer = SFTTrainer(
         model=model,
         tokenizer=tokenizer,