Delta-Vector
/

Pascal-12B

Text Generation

image-text-to-text

nsfw

creative writing

text-generation-inference

Model card Files Files and versions

Delta-Vector commited on Apr 13, 2025

Commit

642b324

·

verified ·

1 Parent(s): 99b5b81

Update README.md

Files changed (1) hide show

README.md +26 -1

README.md CHANGED Viewed

@@ -257,7 +257,32 @@ Or you can try out Gemma-T4 (Thanks to Sleepdeprived) : https://huggingface.co/s
     <details>
       <summary>SFT Trainer Config</summary>
       <pre><code>
 </code></pre>
     </details>
   </div>

     <details>
       <summary>SFT Trainer Config</summary>
       <pre><code>
+trainer = SFTTrainer(
+    model=model,
+    tokenizer=tokenizer,
+    train_dataset=dataset,
+    eval_dataset=None,
+    args=SFTConfig(
+        dataset_text_field="text",
+        per_device_train_batch_size=1,
+        gradient_accumulation_steps=4,
+        warmup_steps=50,
+        num_train_epochs=1,
+        learning_rate=1e-4,
+        max_grad_norm=0.2,
+        logging_steps=1,
+        optim="paged_adamw_8bit",
+        weight_decay=0.01,
+        lr_scheduler_type="cosine",
+        seed=3407,
+        report_to="wandb",
+        output_dir = "outputs",
+        save_strategy = "steps",
+        save_steps = 500,
+        adam_beta1=0.92,
+        adam_beta2=0.999,
+    ),
+)
 </code></pre>
     </details>
   </div>