Training in progress, step 45000

Browse files

Files changed (7) hide show

last-checkpoint/optimizer.pt +1 -1
last-checkpoint/pytorch_model.bin +1 -1
last-checkpoint/rng_state.pth +1 -1
last-checkpoint/scaler.pt +1 -1
last-checkpoint/scheduler.pt +1 -1
last-checkpoint/trainer_state.json +103 -3
pytorch_model.bin +1 -1

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:8364802d21dd9f982e45881cc79c347aa3801886af5229e46080ee91f3907fe6
 size 893438545

 version https://git-lfs.github.com/spec/v1
+oid sha256:974a1e790d3ca33c068dbaca3cc4297bfcbca347437b8b9cb62025728f09e96e
 size 893438545

last-checkpoint/pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:d09408dd133bba0b615b1fc392982c3e187892b1f9f86f244d616011599238fa
 size 449471589

 version https://git-lfs.github.com/spec/v1
+oid sha256:c5a9d277649a19c26574f85a21d72156907a1fa49083c31e96d8eb40d2455fc4
 size 449471589

last-checkpoint/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:7452543a8fbf992ab3cce28416697ef7ccf235bef8f9b12b8a45f822598554fe
 size 15523

 version https://git-lfs.github.com/spec/v1
+oid sha256:fe764e4b14b1a41f602255c5ad661b82e79519ef62fb0a01c7236478ec943d57
 size 15523

last-checkpoint/scaler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:c140b5a229b9a3368f84f81bd05277429e8fd4356be63302dcf2f4ec2ee074c7
 size 559

 version https://git-lfs.github.com/spec/v1
+oid sha256:a3c1e2756d4a4685b9df2f62aad4f5988b6c0b032f0fc7cb98d4e77d5c23a8e8
 size 559

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:668b6868588ce6f6b1dad74dfa79e9c675d217e8314657782f2e491c66698c2c
 size 623

 version https://git-lfs.github.com/spec/v1
+oid sha256:584cc9786ad375313cf5cd3cfaf9ab2fa5956cf7f817f1132bf8fc5dbd46f871
 size 623

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
   "best_metric": null,
   "best_model_checkpoint": null,
-  "epoch": 3.402517863218782,
-  "global_step": 40000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -806,11 +806,111 @@
       "eval_samples_per_second": 32.806,
       "eval_steps_per_second": 1.05,
       "step": 40000
     }
   ],
   "max_steps": 1000000,
   "num_train_epochs": 86,
-  "total_flos": 1.84008340746311e+21,
   "trial_name": null,
   "trial_params": null
 }

 {
   "best_metric": null,
   "best_model_checkpoint": null,
+  "epoch": 3.8278325961211297,
+  "global_step": 45000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_samples_per_second": 32.806,
       "eval_steps_per_second": 1.05,
       "step": 40000
+    },
+    {
+      "epoch": 3.45,
+      "learning_rate": 9.999999999999999e-06,
+      "loss": 0.4167,
+      "step": 40500
+    },
+    {
+      "epoch": 3.49,
+      "learning_rate": 9.999999999999999e-06,
+      "loss": 0.417,
+      "step": 41000
+    },
+    {
+      "epoch": 3.49,
+      "eval_loss": 0.38663551211357117,
+      "eval_runtime": 24.5074,
+      "eval_samples_per_second": 20.402,
+      "eval_steps_per_second": 0.653,
+      "step": 41000
+    },
+    {
+      "epoch": 3.53,
+      "learning_rate": 9.999999999999999e-06,
+      "loss": 0.4168,
+      "step": 41500
+    },
+    {
+      "epoch": 3.57,
+      "learning_rate": 9.999999999999999e-06,
+      "loss": 0.4159,
+      "step": 42000
+    },
+    {
+      "epoch": 3.57,
+      "eval_loss": 0.38440173864364624,
+      "eval_runtime": 30.9795,
+      "eval_samples_per_second": 16.14,
+      "eval_steps_per_second": 0.516,
+      "step": 42000
+    },
+    {
+      "epoch": 3.62,
+      "learning_rate": 9.999999999999999e-06,
+      "loss": 0.4151,
+      "step": 42500
+    },
+    {
+      "epoch": 3.66,
+      "learning_rate": 9.999999999999999e-06,
+      "loss": 0.4155,
+      "step": 43000
+    },
+    {
+      "epoch": 3.66,
+      "eval_loss": 0.3864738941192627,
+      "eval_runtime": 24.9969,
+      "eval_samples_per_second": 20.002,
+      "eval_steps_per_second": 0.64,
+      "step": 43000
+    },
+    {
+      "epoch": 3.7,
+      "learning_rate": 9.999999999999999e-06,
+      "loss": 0.4157,
+      "step": 43500
+    },
+    {
+      "epoch": 3.74,
+      "learning_rate": 9.999999999999999e-06,
+      "loss": 0.4158,
+      "step": 44000
+    },
+    {
+      "epoch": 3.74,
+      "eval_loss": 0.3862515091896057,
+      "eval_runtime": 28.5688,
+      "eval_samples_per_second": 17.502,
+      "eval_steps_per_second": 0.56,
+      "step": 44000
+    },
+    {
+      "epoch": 3.79,
+      "learning_rate": 9.999999999999999e-06,
+      "loss": 0.4147,
+      "step": 44500
+    },
+    {
+      "epoch": 3.83,
+      "learning_rate": 9.999999999999999e-06,
+      "loss": 0.4134,
+      "step": 45000
+    },
+    {
+      "epoch": 3.83,
+      "eval_loss": 0.38480713963508606,
+      "eval_runtime": 27.3513,
+      "eval_samples_per_second": 18.281,
+      "eval_steps_per_second": 0.585,
+      "step": 45000
     }
   ],
   "max_steps": 1000000,
   "num_train_epochs": 86,
+  "total_flos": 2.0700998918659003e+21,
   "trial_name": null,
   "trial_params": null
 }

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:d09408dd133bba0b615b1fc392982c3e187892b1f9f86f244d616011599238fa
 size 449471589

 version https://git-lfs.github.com/spec/v1
+oid sha256:c5a9d277649a19c26574f85a21d72156907a1fa49083c31e96d8eb40d2455fc4
 size 449471589