Training in progress, step 85000

Browse files

Files changed (7) hide show

last-checkpoint/optimizer.pt +1 -1
last-checkpoint/pytorch_model.bin +1 -1
last-checkpoint/rng_state.pth +1 -1
last-checkpoint/scaler.pt +1 -1
last-checkpoint/scheduler.pt +1 -1
last-checkpoint/trainer_state.json +103 -3
pytorch_model.bin +1 -1

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:7ddeabb9ead685c5e5b416b4a981e11a787d94773db5c89384835f8ea6b2e1c4
 size 893439185

 version https://git-lfs.github.com/spec/v1
+oid sha256:472cad01c0a9f1ea8aaf84bdb45dfc7c4e1c36ba4b8820b938132e82c0227a88
 size 893439185

last-checkpoint/pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:98dacb4579cc2ad8d273f8bac5c3977b66490dafa2ef002d312807df6670d4cd
 size 449471589

 version https://git-lfs.github.com/spec/v1
+oid sha256:6e9bb790cd1ed6619be446085ee0ce0f578bbf0f5bde03c7c17fa7ab47347b58
 size 449471589

last-checkpoint/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:79b99893c9b02fa371856f47a0ec288962436c435769873b9db7532898348d23
 size 15523

 version https://git-lfs.github.com/spec/v1
+oid sha256:5a4db40485e0cc2ae2c7d4666298527a0e5fe43aae4d4d36410c256797b9d7b2
 size 15523

last-checkpoint/scaler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:56e8d48d0939e6a173efa67076df748028040c8480b0133ac53f27544c88363a
 size 559

 version https://git-lfs.github.com/spec/v1
+oid sha256:e73dcc385f3727cd90553fcdf4bbe518206c0aac0c3e0ac90d3a37a051bed3f6
 size 559

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:71d5e106c9d23676ccfa26cba844ba11ee123c667bd6da5c807ecc94bb13e886
 size 623

 version https://git-lfs.github.com/spec/v1
+oid sha256:2d6681857d812c4003058a73db89e98a889fba488550009396931874d6b944fb
 size 623

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
   "best_metric": null,
   "best_model_checkpoint": null,
-  "epoch": 6.805035726437564,
-  "global_step": 80000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -1606,11 +1606,111 @@
       "eval_samples_per_second": 29.995,
       "eval_steps_per_second": 0.96,
       "step": 80000
     }
   ],
   "max_steps": 1000000,
   "num_train_epochs": 86,
-  "total_flos": 3.680166814926219e+21,
   "trial_name": null,
   "trial_params": null
 }

 {
   "best_metric": null,
   "best_model_checkpoint": null,
+  "epoch": 7.2303504593399115,
+  "global_step": 85000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_samples_per_second": 29.995,
       "eval_steps_per_second": 0.96,
       "step": 80000
+    },
+    {
+      "epoch": 6.85,
+      "learning_rate": 9.999999999999999e-06,
+      "loss": 0.4036,
+      "step": 80500
+    },
+    {
+      "epoch": 6.89,
+      "learning_rate": 9.999999999999999e-06,
+      "loss": 0.4035,
+      "step": 81000
+    },
+    {
+      "epoch": 6.89,
+      "eval_loss": 0.3746860921382904,
+      "eval_runtime": 15.7109,
+      "eval_samples_per_second": 31.825,
+      "eval_steps_per_second": 1.018,
+      "step": 81000
+    },
+    {
+      "epoch": 6.93,
+      "learning_rate": 9.999999999999999e-06,
+      "loss": 0.4037,
+      "step": 81500
+    },
+    {
+      "epoch": 6.98,
+      "learning_rate": 9.999999999999999e-06,
+      "loss": 0.4045,
+      "step": 82000
+    },
+    {
+      "epoch": 6.98,
+      "eval_loss": 0.37363681197166443,
+      "eval_runtime": 22.9088,
+      "eval_samples_per_second": 21.826,
+      "eval_steps_per_second": 0.698,
+      "step": 82000
+    },
+    {
+      "epoch": 7.02,
+      "learning_rate": 9.999999999999999e-06,
+      "loss": 0.4035,
+      "step": 82500
+    },
+    {
+      "epoch": 7.06,
+      "learning_rate": 9.999999999999999e-06,
+      "loss": 0.4031,
+      "step": 83000
+    },
+    {
+      "epoch": 7.06,
+      "eval_loss": 0.37529370188713074,
+      "eval_runtime": 14.7314,
+      "eval_samples_per_second": 33.941,
+      "eval_steps_per_second": 1.086,
+      "step": 83000
+    },
+    {
+      "epoch": 7.1,
+      "learning_rate": 9.999999999999999e-06,
+      "loss": 0.402,
+      "step": 83500
+    },
+    {
+      "epoch": 7.15,
+      "learning_rate": 9.999999999999999e-06,
+      "loss": 0.4042,
+      "step": 84000
+    },
+    {
+      "epoch": 7.15,
+      "eval_loss": 0.37475818395614624,
+      "eval_runtime": 15.8331,
+      "eval_samples_per_second": 31.579,
+      "eval_steps_per_second": 1.011,
+      "step": 84000
+    },
+    {
+      "epoch": 7.19,
+      "learning_rate": 9.999999999999999e-06,
+      "loss": 0.4032,
+      "step": 84500
+    },
+    {
+      "epoch": 7.23,
+      "learning_rate": 9.999999999999999e-06,
+      "loss": 0.4029,
+      "step": 85000
+    },
+    {
+      "epoch": 7.23,
+      "eval_loss": 0.3748987317085266,
+      "eval_runtime": 17.2956,
+      "eval_samples_per_second": 28.909,
+      "eval_steps_per_second": 0.925,
+      "step": 85000
     }
   ],
   "max_steps": 1000000,
   "num_train_epochs": 86,
+  "total_flos": 3.9101671434092717e+21,
   "trial_name": null,
   "trial_params": null
 }

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:98dacb4579cc2ad8d273f8bac5c3977b66490dafa2ef002d312807df6670d4cd
 size 449471589

 version https://git-lfs.github.com/spec/v1
+oid sha256:6e9bb790cd1ed6619be446085ee0ce0f578bbf0f5bde03c7c17fa7ab47347b58
 size 449471589