VortexHunter23
/

Shed-Coder-0.1

Text Generation

text-generation-inference

4-bit precision

Model card Files Files and versions

VortexHunter23 commited on May 26, 2025

Commit

76f0e5a

·

verified ·

1 Parent(s): 1b34bc1

Update README.md

Files changed (1) hide show

README.md +34 -0

README.md CHANGED Viewed

@@ -11,6 +11,40 @@ license: apache-2.0
 language:
 - en
 ---
 # Uploaded  model

 language:
 - en
 ---
+from trl import SFTTrainer
+from transformers import TrainingArguments
+from unsloth import is_bfloat16_supported
+trainer = SFTTrainer(
+    model = model,
+    tokenizer = tokenizer,
+    train_dataset = dataset,
+    dataset_text_field = "text",
+    max_seq_length = max_seq_length,
+    dataset_num_proc = 2,
+    packing = False, # Can make training 5x faster for short sequences.
+    args = TrainingArguments(
+        per_device_train_batch_size = 2,
+        gradient_accumulation_steps = 4,
+        warmup_steps = 5,
+        num_train_epochs = 1, # Set this for 1 full training run.
+        max_steps = 100,
+        learning_rate = 2e-4,
+        fp16 = not is_bfloat16_supported(),
+        bf16 = is_bfloat16_supported(),
+        logging_steps = 1,
+        optim = "adamw_8bit",
+        weight_decay = 0.01,
+        lr_scheduler_type = "linear",
+        seed = 3407,
+        output_dir = "outputs",
+        save_strategy = "steps",
+        save_steps = 60,
+        report_to = "none", # Use this for WandB etc
+    ),
+)
 # Uploaded  model