tangledgroup
/

tangled-alpha-0.9-core

Text Generation

Model card Files Files and versions

mtasic85 commited on Mar 15, 2025

Commit

586c286

·

1 Parent(s): 095febe

cpt core 4

Files changed (1) hide show

scripts/cpt_core_model_4.py +4 -2

scripts/cpt_core_model_4.py CHANGED Viewed

@@ -88,8 +88,10 @@ trainer = UnslothTrainer(
     args = UnslothTrainingArguments(
         # per_device_train_batch_size=16,
         # gradient_accumulation_steps=64,
-        per_device_train_batch_size=16,
-        gradient_accumulation_steps=16,
         warmup_ratio=0,
         num_train_epochs=1,

     args = UnslothTrainingArguments(
         # per_device_train_batch_size=16,
         # gradient_accumulation_steps=64,
+        # per_device_train_batch_size=16,
+        # gradient_accumulation_steps=16,
+        per_device_train_batch_size=2,
+        gradient_accumulation_steps=8,
         warmup_ratio=0,
         num_train_epochs=1,