Training in progress, step 40000

Browse files

Files changed (7) hide show

last-checkpoint/optimizer.pt +1 -1
last-checkpoint/pytorch_model.bin +1 -1
last-checkpoint/rng_state.pth +1 -1
last-checkpoint/scaler.pt +1 -1
last-checkpoint/scheduler.pt +1 -1
last-checkpoint/trainer_state.json +103 -3
pytorch_model.bin +1 -1

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:88b8a99831b810a81afda5499f89d37d313f57de0e44acfd6fda4ffa5d407961
 size 893438545

 version https://git-lfs.github.com/spec/v1
+oid sha256:8364802d21dd9f982e45881cc79c347aa3801886af5229e46080ee91f3907fe6
 size 893438545

last-checkpoint/pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:2eec5be5134af20148899e71dab937c29c165b2f523524e79200da7b125e7331
 size 449471589

 version https://git-lfs.github.com/spec/v1
+oid sha256:d09408dd133bba0b615b1fc392982c3e187892b1f9f86f244d616011599238fa
 size 449471589

last-checkpoint/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:8930b754593f69ea99a69818713906027d8b18db77040fbc82850fb457145d53
 size 15523

 version https://git-lfs.github.com/spec/v1
+oid sha256:7452543a8fbf992ab3cce28416697ef7ccf235bef8f9b12b8a45f822598554fe
 size 15523

last-checkpoint/scaler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:7f3636d5d5906420899d9a721abefc725ca1bec46f94db174f2d813e8cafd619
 size 559

 version https://git-lfs.github.com/spec/v1
+oid sha256:c140b5a229b9a3368f84f81bd05277429e8fd4356be63302dcf2f4ec2ee074c7
 size 559

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:304d89faced0aa75098d224436ef3865f3b1d27481cbd97cf9d9b995cd4a60e9
 size 623

 version https://git-lfs.github.com/spec/v1
+oid sha256:668b6868588ce6f6b1dad74dfa79e9c675d217e8314657782f2e491c66698c2c
 size 623

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
   "best_metric": null,
   "best_model_checkpoint": null,
-  "epoch": 2.9772031303164344,
-  "global_step": 35000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -706,11 +706,111 @@
       "eval_samples_per_second": 29.603,
       "eval_steps_per_second": 0.947,
       "step": 35000
     }
   ],
   "max_steps": 1000000,
   "num_train_epochs": 86,
-  "total_flos": 1.6100830789800572e+21,
   "trial_name": null,
   "trial_params": null
 }

 {
   "best_metric": null,
   "best_model_checkpoint": null,
+  "epoch": 3.402517863218782,
+  "global_step": 40000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_samples_per_second": 29.603,
       "eval_steps_per_second": 0.947,
       "step": 35000
+    },
+    {
+      "epoch": 3.02,
+      "learning_rate": 9.999999999999999e-06,
+      "loss": 0.4195,
+      "step": 35500
+    },
+    {
+      "epoch": 3.06,
+      "learning_rate": 9.999999999999999e-06,
+      "loss": 0.4194,
+      "step": 36000
+    },
+    {
+      "epoch": 3.06,
+      "eval_loss": 0.38856348395347595,
+      "eval_runtime": 16.5028,
+      "eval_samples_per_second": 30.298,
+      "eval_steps_per_second": 0.97,
+      "step": 36000
+    },
+    {
+      "epoch": 3.1,
+      "learning_rate": 9.999999999999999e-06,
+      "loss": 0.4193,
+      "step": 36500
+    },
+    {
+      "epoch": 3.15,
+      "learning_rate": 9.999999999999999e-06,
+      "loss": 0.4208,
+      "step": 37000
+    },
+    {
+      "epoch": 3.15,
+      "eval_loss": 0.3889642059803009,
+      "eval_runtime": 28.0106,
+      "eval_samples_per_second": 17.85,
+      "eval_steps_per_second": 0.571,
+      "step": 37000
+    },
+    {
+      "epoch": 3.19,
+      "learning_rate": 9.999999999999999e-06,
+      "loss": 0.4189,
+      "step": 37500
+    },
+    {
+      "epoch": 3.23,
+      "learning_rate": 9.999999999999999e-06,
+      "loss": 0.4187,
+      "step": 38000
+    },
+    {
+      "epoch": 3.23,
+      "eval_loss": 0.3886989653110504,
+      "eval_runtime": 15.6007,
+      "eval_samples_per_second": 32.05,
+      "eval_steps_per_second": 1.026,
+      "step": 38000
+    },
+    {
+      "epoch": 3.27,
+      "learning_rate": 9.999999999999999e-06,
+      "loss": 0.4181,
+      "step": 38500
+    },
+    {
+      "epoch": 3.32,
+      "learning_rate": 9.999999999999999e-06,
+      "loss": 0.417,
+      "step": 39000
+    },
+    {
+      "epoch": 3.32,
+      "eval_loss": 0.3878667950630188,
+      "eval_runtime": 14.893,
+      "eval_samples_per_second": 33.573,
+      "eval_steps_per_second": 1.074,
+      "step": 39000
+    },
+    {
+      "epoch": 3.36,
+      "learning_rate": 9.999999999999999e-06,
+      "loss": 0.4176,
+      "step": 39500
+    },
+    {
+      "epoch": 3.4,
+      "learning_rate": 9.999999999999999e-06,
+      "loss": 0.4164,
+      "step": 40000
+    },
+    {
+      "epoch": 3.4,
+      "eval_loss": 0.3855785131454468,
+      "eval_runtime": 15.2409,
+      "eval_samples_per_second": 32.806,
+      "eval_steps_per_second": 1.05,
+      "step": 40000
     }
   ],
   "max_steps": 1000000,
   "num_train_epochs": 86,
+  "total_flos": 1.84008340746311e+21,
   "trial_name": null,
   "trial_params": null
 }

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:2eec5be5134af20148899e71dab937c29c165b2f523524e79200da7b125e7331
 size 449471589

 version https://git-lfs.github.com/spec/v1
+oid sha256:d09408dd133bba0b615b1fc392982c3e187892b1f9f86f244d616011599238fa
 size 449471589