Training in progress, step 25, checkpoint

Browse files

Files changed (5) hide show

last-checkpoint/adapter_model.safetensors +1 -1
last-checkpoint/optimizer.pt +1 -1
last-checkpoint/rng_state.pth +1 -1
last-checkpoint/scheduler.pt +1 -1
last-checkpoint/trainer_state.json +54 -3

last-checkpoint/adapter_model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:b79d6c738525786d8d024bebde7ff54252eade5a767213fcce4683fdcd8800e4
 size 45118424

 version https://git-lfs.github.com/spec/v1
+oid sha256:31cbaf9f678fb5252161490e7de95855e09d9f5a4bee67c60dc0b199da4a6b53
 size 45118424

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:dd114e07ac02776a619f90cdd586afe7eeed91c34f863224075824ea5a7e6e77
 size 23159290

 version https://git-lfs.github.com/spec/v1
+oid sha256:4fe342709cbad6397e41ae1e5c634ef6e4b377eb7e04ad4b2e12e258c1aeb717
 size 23159290

last-checkpoint/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:27b9c1be8d8bae4df98ae1a27353c07078eed013c40757a6521cd0fbfb3c8fb9
 size 14244

 version https://git-lfs.github.com/spec/v1
+oid sha256:7e90410ed8d75deee232d46a71672a78439ef812c0e8c37ade4c255c49bee23b
 size 14244

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a62e6ea25099651400ff4a3142a50e40bef5b52ba883be53b2fcb9d1a5b0a98c
 size 1064

 version https://git-lfs.github.com/spec/v1
+oid sha256:cc8ae5b9632b883900417a4b328f111a055e2a3387d176daa619ce2ea248142d
 size 1064

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,9 +1,9 @@
 {
   "best_metric": null,
   "best_model_checkpoint": null,
-  "epoch": 1.880952380952381,
   "eval_steps": 3,
-  "global_step": 20,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -203,6 +203,57 @@
       "learning_rate": 0.0001,
       "loss": 1.2653,
       "step": 20
     }
   ],
   "logging_steps": 1,
@@ -222,7 +273,7 @@
       "attributes": {}
     }
   },
-  "total_flos": 3791128769593344.0,
   "train_batch_size": 2,
   "trial_name": null,
   "trial_params": null

 {
   "best_metric": null,
   "best_model_checkpoint": null,
+  "epoch": 2.3333333333333335,
   "eval_steps": 3,
+  "global_step": 25,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "learning_rate": 0.0001,
       "loss": 1.2653,
       "step": 20
+    },
+    {
+      "epoch": 1.9761904761904763,
+      "grad_norm": 0.17035318911075592,
+      "learning_rate": 8.435655349597689e-05,
+      "loss": 1.1873,
+      "step": 21
+    },
+    {
+      "epoch": 1.9761904761904763,
+      "eval_loss": 1.1423017978668213,
+      "eval_runtime": 6.2847,
+      "eval_samples_per_second": 15.912,
+      "eval_steps_per_second": 7.956,
+      "step": 21
+    },
+    {
+      "epoch": 2.0476190476190474,
+      "grad_norm": 0.20932504534721375,
+      "learning_rate": 6.909830056250527e-05,
+      "loss": 1.1359,
+      "step": 22
+    },
+    {
+      "epoch": 2.142857142857143,
+      "grad_norm": 0.1693231463432312,
+      "learning_rate": 5.4600950026045326e-05,
+      "loss": 1.1202,
+      "step": 23
+    },
+    {
+      "epoch": 2.238095238095238,
+      "grad_norm": 0.16167840361595154,
+      "learning_rate": 4.12214747707527e-05,
+      "loss": 1.1978,
+      "step": 24
+    },
+    {
+      "epoch": 2.238095238095238,
+      "eval_loss": 1.1400079727172852,
+      "eval_runtime": 6.3594,
+      "eval_samples_per_second": 15.725,
+      "eval_steps_per_second": 7.862,
+      "step": 24
+    },
+    {
+      "epoch": 2.3333333333333335,
+      "grad_norm": 0.16464297473430634,
+      "learning_rate": 2.9289321881345254e-05,
+      "loss": 1.1135,
+      "step": 25
     }
   ],
   "logging_steps": 1,
       "attributes": {}
     }
   },
+  "total_flos": 4707063061020672.0,
   "train_batch_size": 2,
   "trial_name": null,
   "trial_params": null