Training in progress, step 65000

Browse files

Files changed (7) hide show

last-checkpoint/optimizer.pt +1 -1
last-checkpoint/pytorch_model.bin +1 -1
last-checkpoint/rng_state.pth +1 -1
last-checkpoint/scaler.pt +1 -1
last-checkpoint/scheduler.pt +1 -1
last-checkpoint/trainer_state.json +103 -3
pytorch_model.bin +1 -1

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:abf4891b4d7d549b998893b34a4d7fda74fe4d926dd8829b0fd1f3ebe9e05331
 size 893438545

 version https://git-lfs.github.com/spec/v1
+oid sha256:988099a377e3ae6ef89fd2f1f761be64fa6a19032354dab4bc5333d2740798f7
 size 893438545

last-checkpoint/pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:18a2bbc1e1a7ffff89dca088c920d657df7faf45dedf18ccd7ee5e4d0208668c
 size 449471589

 version https://git-lfs.github.com/spec/v1
+oid sha256:65f03d0e43e34a2e0bd81bc161f8b22fc6c59b8c9b7c6cda78db789b3b576cc9
 size 449471589

last-checkpoint/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:6674133d74344ac7df609ac13da3436a0f3992a815e6582851a68fd5a7ad5e18
 size 15523

 version https://git-lfs.github.com/spec/v1
+oid sha256:8d496ee2298f65cd4dad9053d5676d64850869fdb37f1b20e4f79d1c4026aca1
 size 15523

last-checkpoint/scaler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:337ac944c1300b5fad5b6313f7b0d4a29d6bf7750594a32866e96847ec6ec635
 size 559

 version https://git-lfs.github.com/spec/v1
+oid sha256:9941c77ea6765c024840da9e5a9b406fef84b8e5ef3a55221f4dca4db4e76a10
 size 559

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:19d585522f5a4f4e47c69e3dfd034779da400358487b840d5af1cf4b0f318c1e
 size 623

 version https://git-lfs.github.com/spec/v1
+oid sha256:de3c7b468f562a170fe98313b8778b6d4fc7ff5fb03b102a017eca4a43908ee2
 size 623

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
   "best_metric": null,
   "best_model_checkpoint": null,
-  "epoch": 5.103776794828173,
-  "global_step": 60000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -1206,11 +1206,111 @@
       "eval_samples_per_second": 25.283,
       "eval_steps_per_second": 0.809,
       "step": 60000
     }
   ],
   "max_steps": 1000000,
   "num_train_epochs": 86,
-  "total_flos": 2.7601170332347956e+21,
   "trial_name": null,
   "trial_params": null
 }

 {
   "best_metric": null,
   "best_model_checkpoint": null,
+  "epoch": 5.529091527730521,
+  "global_step": 65000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_samples_per_second": 25.283,
       "eval_steps_per_second": 0.809,
       "step": 60000
+    },
+    {
+      "epoch": 5.15,
+      "learning_rate": 9.999999999999999e-06,
+      "loss": 0.4108,
+      "step": 60500
+    },
+    {
+      "epoch": 5.19,
+      "learning_rate": 9.999999999999999e-06,
+      "loss": 0.4094,
+      "step": 61000
+    },
+    {
+      "epoch": 5.19,
+      "eval_loss": 0.3796501159667969,
+      "eval_runtime": 18.1293,
+      "eval_samples_per_second": 27.58,
+      "eval_steps_per_second": 0.883,
+      "step": 61000
+    },
+    {
+      "epoch": 5.23,
+      "learning_rate": 9.999999999999999e-06,
+      "loss": 0.4092,
+      "step": 61500
+    },
+    {
+      "epoch": 5.27,
+      "learning_rate": 9.999999999999999e-06,
+      "loss": 0.4091,
+      "step": 62000
+    },
+    {
+      "epoch": 5.27,
+      "eval_loss": 0.3790924549102783,
+      "eval_runtime": 20.9048,
+      "eval_samples_per_second": 23.918,
+      "eval_steps_per_second": 0.765,
+      "step": 62000
+    },
+    {
+      "epoch": 5.32,
+      "learning_rate": 9.999999999999999e-06,
+      "loss": 0.408,
+      "step": 62500
+    },
+    {
+      "epoch": 5.36,
+      "learning_rate": 9.999999999999999e-06,
+      "loss": 0.4102,
+      "step": 63000
+    },
+    {
+      "epoch": 5.36,
+      "eval_loss": 0.3805426061153412,
+      "eval_runtime": 27.4404,
+      "eval_samples_per_second": 18.221,
+      "eval_steps_per_second": 0.583,
+      "step": 63000
+    },
+    {
+      "epoch": 5.4,
+      "learning_rate": 9.999999999999999e-06,
+      "loss": 0.4086,
+      "step": 63500
+    },
+    {
+      "epoch": 5.44,
+      "learning_rate": 9.999999999999999e-06,
+      "loss": 0.4087,
+      "step": 64000
+    },
+    {
+      "epoch": 5.44,
+      "eval_loss": 0.37830984592437744,
+      "eval_runtime": 14.8851,
+      "eval_samples_per_second": 33.591,
+      "eval_steps_per_second": 1.075,
+      "step": 64000
+    },
+    {
+      "epoch": 5.49,
+      "learning_rate": 9.999999999999999e-06,
+      "loss": 0.4081,
+      "step": 64500
+    },
+    {
+      "epoch": 5.53,
+      "learning_rate": 9.999999999999999e-06,
+      "loss": 0.4083,
+      "step": 65000
+    },
+    {
+      "epoch": 5.53,
+      "eval_loss": 0.3796636164188385,
+      "eval_runtime": 17.3567,
+      "eval_samples_per_second": 28.807,
+      "eval_steps_per_second": 0.922,
+      "step": 65000
     }
   ],
   "max_steps": 1000000,
   "num_train_epochs": 86,
+  "total_flos": 2.990133517637586e+21,
   "trial_name": null,
   "trial_params": null
 }

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:18a2bbc1e1a7ffff89dca088c920d657df7faf45dedf18ccd7ee5e4d0208668c
 size 449471589

 version https://git-lfs.github.com/spec/v1
+oid sha256:65f03d0e43e34a2e0bd81bc161f8b22fc6c59b8c9b7c6cda78db789b3b576cc9
 size 449471589