Gemma-Train

Sleeping

turtle170 commited on Jan 25

Commit

15766f5

verified ·

1 Parent(s): a989f99

Update config.yaml

Files changed (1) hide show

config.yaml CHANGED Viewed

@@ -1,5 +1,5 @@
 task: llm-generic
-base_model: google/gemma-3-4b-pt
 project_name: gemma-3-reasoning-sft
 log: tensorboard
 backend: local
@@ -10,7 +10,7 @@ data:
   valid_split: null
   chat_template: chatml
   column_mapping:
-    text_column: text
 params:
   trainer: sft
@@ -19,12 +19,12 @@ params:
   optimizer: adamw_bnb_8bit
   peft: true
   lora_r: 256
-  lora_alpha: 512
   lora_target_modules: all-linear
   block_size: 4096
   batch_size: 2
   gradient_accumulation: 8
-  lr: 1e-4
   epochs: 1
   warmup_ratio: 0.1
   logging_steps: 1

 task: llm-generic
+base_model: unsloth/gemma-3-4b-pt-bnb-4bit
 project_name: gemma-3-reasoning-sft
 log: tensorboard
 backend: local
   valid_split: null
   chat_template: chatml
   column_mapping:
+    text_column: conversations
 params:
   trainer: sft
   optimizer: adamw_bnb_8bit
   peft: true
   lora_r: 256
+  lora_alpha: 256
   lora_target_modules: all-linear
   block_size: 4096
   batch_size: 2
   gradient_accumulation: 8
+  lr: 5e-5
   epochs: 1
   warmup_ratio: 0.1
   logging_steps: 1