Rustamshry
/

Llama3.2-SQL-1B

Text Generation

Model card Files Files and versions

Rustamshry commited on May 18, 2025

Commit

0595245

·

verified ·

1 Parent(s): 6b91fa1

Update README.md

Files changed (1) hide show

README.md +9 -9

README.md CHANGED Viewed

@@ -112,15 +112,15 @@ The model was fine-tuned using the Unsloth and LoRA.
 #### Training Hyperparameters
-  -**batch size**:8,
-  -**gradient accumulation steps**:4,
-  -**optimizer**:adamw_torch,
-  -**learning rate**:2e-5,
-  -**warmup_steps**:100,
-  -**fp16**:True,
-  -**epochs**:2,
-  -**weight_decay**:0.01,
-  -**lr_scheduler_type**:linear
 #### Speeds, Sizes, Times [optional]

 #### Training Hyperparameters
+- batch size:8,
+- gradient accumulation steps:4,
+- optimizer:adamw_torch,
+- learning rate:2e-5,
+- warmup_steps:100,
+- fp16:True,
+- epochs:2,
+- weight_decay:0.01,
+- lr_scheduler_type:linear
 #### Speeds, Sizes, Times [optional]