Upload folder using huggingface_hub

Browse files

Files changed (5) hide show

adapter_model.safetensors +1 -1
optimizer.pt +1 -1
rng_state.pth +1 -1
scheduler.pt +1 -1
trainer_state.json +7 -112

adapter_model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:6f59f1a583963d421ac23948e79a9a6d7a43d73f7425dc3f81a1c3fba0234b14
 size 738232680

 version https://git-lfs.github.com/spec/v1
+oid sha256:90f012c442accfa6f38a4282c517cdcc4287c8d382b12c8202d20a6d21141576
 size 738232680

optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:62dee84323e49bce2894834a449efb717fb4f5c0e43b0fc53908d8314f0fea2d
 size 1476611275

 version https://git-lfs.github.com/spec/v1
+oid sha256:8d92483e7ef82d62e4cefd6d7ae69e21b950d46ba883869dbfcced86267a001e
 size 1476611275

rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:adb5558d81e37e22ad7ef00a5b98b4bbabdb72c5cf774602127ab6ff043ccfad
 size 14645

 version https://git-lfs.github.com/spec/v1
+oid sha256:5d1bc75e2fb0afb4cdce6286143bee936f37febf68cc744d52dbaaafbfa7bcf7
 size 14645

scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:3105ebe8471f9890c3eb1f20cc0f2520fa5fdb0128474bbc87e607b2ec7c53dc
 size 1465

 version https://git-lfs.github.com/spec/v1
+oid sha256:7db8e7bffe73040ea5cd93ece4d9c142345880217e710213ff0948759dd1246e
 size 1465

trainer_state.json CHANGED Viewed

@@ -1,10 +1,10 @@
 {
-  "best_global_step": 500,
-  "best_metric": 0.0006410721107386053,
-  "best_model_checkpoint": "/content/drive/MyDrive/lora_model/outputs/task15_microsoft/Phi-4-mini-instruct/checkpoint-500",
-  "epoch": 33.333333333333336,
   "eval_steps": 500,
-  "global_step": 500,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -413,111 +413,6 @@
       "eval_samples_per_second": 8.795,
       "eval_steps_per_second": 1.173,
       "step": 405
-    },
-    {
-      "epoch": 28.0,
-      "grad_norm": 0.015260938555002213,
-      "learning_rate": 3.3628723335213885e-06,
-      "loss": 0.0007,
-      "step": 420
-    },
-    {
-      "epoch": 28.0,
-      "eval_loss": 0.0006676352932117879,
-      "eval_runtime": 3.4094,
-      "eval_samples_per_second": 8.799,
-      "eval_steps_per_second": 1.173,
-      "step": 420
-    },
-    {
-      "epoch": 29.0,
-      "grad_norm": 0.01491440087556839,
-      "learning_rate": 2.250035618801241e-06,
-      "loss": 0.0007,
-      "step": 435
-    },
-    {
-      "epoch": 29.0,
-      "eval_loss": 0.0006499449955299497,
-      "eval_runtime": 3.409,
-      "eval_samples_per_second": 8.8,
-      "eval_steps_per_second": 1.173,
-      "step": 435
-    },
-    {
-      "epoch": 30.0,
-      "grad_norm": 0.014446167275309563,
-      "learning_rate": 1.351802905002386e-06,
-      "loss": 0.0006,
-      "step": 450
-    },
-    {
-      "epoch": 30.0,
-      "eval_loss": 0.0006467067869380116,
-      "eval_runtime": 3.4096,
-      "eval_samples_per_second": 8.799,
-      "eval_steps_per_second": 1.173,
-      "step": 450
-    },
-    {
-      "epoch": 31.0,
-      "grad_norm": 0.013305812142789364,
-      "learning_rate": 6.766473629355452e-07,
-      "loss": 0.0006,
-      "step": 465
-    },
-    {
-      "epoch": 31.0,
-      "eval_loss": 0.0006454469985328615,
-      "eval_runtime": 3.4011,
-      "eval_samples_per_second": 8.821,
-      "eval_steps_per_second": 1.176,
-      "step": 465
-    },
-    {
-      "epoch": 32.0,
-      "grad_norm": 0.015049861744046211,
-      "learning_rate": 2.3093784127863062e-07,
-      "loss": 0.0006,
-      "step": 480
-    },
-    {
-      "epoch": 32.0,
-      "eval_loss": 0.0006429204368032515,
-      "eval_runtime": 3.404,
-      "eval_samples_per_second": 8.813,
-      "eval_steps_per_second": 1.175,
-      "step": 480
-    },
-    {
-      "epoch": 33.0,
-      "grad_norm": 0.014723357744514942,
-      "learning_rate": 1.8878788223009036e-08,
-      "loss": 0.0006,
-      "step": 495
-    },
-    {
-      "epoch": 33.0,
-      "eval_loss": 0.0006475438713096082,
-      "eval_runtime": 3.4074,
-      "eval_samples_per_second": 8.804,
-      "eval_steps_per_second": 1.174,
-      "step": 495
-    },
-    {
-      "epoch": 33.333333333333336,
-      "grad_norm": 0.014316793531179428,
-      "learning_rate": 5.244749650301639e-10,
-      "loss": 0.0007,
-      "step": 500
-    },
-    {
-      "epoch": 33.333333333333336,
-      "eval_loss": 0.0006410721107386053,
-      "eval_runtime": 3.4172,
-      "eval_samples_per_second": 8.779,
-      "eval_steps_per_second": 1.171,
-      "step": 500
     }
   ],
   "logging_steps": 10,
@@ -532,12 +427,12 @@
         "should_evaluate": false,
         "should_log": false,
         "should_save": true,
-        "should_training_stop": true
       },
       "attributes": {}
     }
   },
-  "total_flos": 2.279189598799872e+16,
   "train_batch_size": 2,
   "trial_name": null,
   "trial_params": null

 {
+  "best_global_step": 405,
+  "best_metric": 0.0006800881819799542,
+  "best_model_checkpoint": "/content/drive/MyDrive/lora_model/outputs/task15_microsoft/Phi-4-mini-instruct/checkpoint-405",
+  "epoch": 27.0,
   "eval_steps": 500,
+  "global_step": 405,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_samples_per_second": 8.795,
       "eval_steps_per_second": 1.173,
       "step": 405
     }
   ],
   "logging_steps": 10,
         "should_evaluate": false,
         "should_log": false,
         "should_save": true,
+        "should_training_stop": false
       },
       "attributes": {}
     }
   },
+  "total_flos": 1.846419663323136e+16,
   "train_batch_size": 2,
   "trial_name": null,
   "trial_params": null