Model save

Files changed (4) hide show

README.md CHANGED Viewed

@@ -43,7 +43,7 @@ The following hyperparameters were used during training:
 - optimizer: Use OptimizerNames.ADAMW_TORCH with betas=(0.9,0.999) and epsilon=1e-08 and optimizer_args=No additional optimizer arguments
 - lr_scheduler_type: cosine
 - lr_scheduler_warmup_ratio: 0.05
-- num_epochs: 3
 ### Training results

 - optimizer: Use OptimizerNames.ADAMW_TORCH with betas=(0.9,0.999) and epsilon=1e-08 and optimizer_args=No additional optimizer arguments
 - lr_scheduler_type: cosine
 - lr_scheduler_warmup_ratio: 0.05
+- num_epochs: 6
 ### Training results

last_checkpoint/adapter_config.json CHANGED Viewed

@@ -26,12 +26,12 @@
   "target_modules": [
     "up_proj",
     "q_proj",
     "o_proj",
-    "k_proj",
     "gate_proj",
     "v_proj",
-    "down_proj",
-    "lm_head"
   ],
   "task_type": "CAUSAL_LM",
   "trainable_token_indices": null,

   "target_modules": [
     "up_proj",
     "q_proj",
+    "down_proj",
     "o_proj",
     "gate_proj",
+    "lm_head",
     "v_proj",
+    "k_proj"
   ],
   "task_type": "CAUSAL_LM",
   "trainable_token_indices": null,

last_checkpoint/adapter_model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:844f2a5e173106531063ed96fcd3335c1512a1875bff73e7740b9667fc41c953
 size 411536704

 version https://git-lfs.github.com/spec/v1
+oid sha256:6df498d1041489cc613969a68cf93b1cfbe3e3530fbc6cb2842fbbbf726c40af
 size 411536704

last_checkpoint/training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:aee9351ba5f906a26347215f4f65f55c5f8b8d2ed5e9681250c6a014243d81e5
 size 5649

 version https://git-lfs.github.com/spec/v1
+oid sha256:f94a5d8c1fd55ce00b568a4d234761ea9edc7e3a01220894231c981544d2250a
 size 5649