Training in progress, step 70000

Browse files

Files changed (7) hide show

last-checkpoint/optimizer.pt +2 -2
last-checkpoint/pytorch_model.bin +1 -1
last-checkpoint/rng_state.pth +1 -1
last-checkpoint/scaler.pt +1 -1
last-checkpoint/scheduler.pt +1 -1
last-checkpoint/trainer_state.json +103 -3
pytorch_model.bin +1 -1

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:988099a377e3ae6ef89fd2f1f761be64fa6a19032354dab4bc5333d2740798f7
-size 893438545

 version https://git-lfs.github.com/spec/v1
+oid sha256:058e818841dd5d8551bdb702bf79c2919a18608fe8d04e481344ab6a9d437053
+size 893439185

last-checkpoint/pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:65f03d0e43e34a2e0bd81bc161f8b22fc6c59b8c9b7c6cda78db789b3b576cc9
 size 449471589

 version https://git-lfs.github.com/spec/v1
+oid sha256:c2aad4c0bf3fb0ed60689c461b583204b374f775ac8f21901c8280987af4fc28
 size 449471589

last-checkpoint/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:8d496ee2298f65cd4dad9053d5676d64850869fdb37f1b20e4f79d1c4026aca1
 size 15523

 version https://git-lfs.github.com/spec/v1
+oid sha256:4674bdfc2111c4be2d53fed27a1a59d3f54df49666b8123e70941223006d6b1b
 size 15523

last-checkpoint/scaler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:9941c77ea6765c024840da9e5a9b406fef84b8e5ef3a55221f4dca4db4e76a10
 size 559

 version https://git-lfs.github.com/spec/v1
+oid sha256:62e6a5cc3a60f7141da7f18b69a3a13de9f897b3f440b905c0f70fda71c091a5
 size 559

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:de3c7b468f562a170fe98313b8778b6d4fc7ff5fb03b102a017eca4a43908ee2
 size 623

 version https://git-lfs.github.com/spec/v1
+oid sha256:e2a44e614402fafbcde75b77e1a195abb137e3c2b1958a6d75361c958ced8160
 size 623

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
   "best_metric": null,
   "best_model_checkpoint": null,
-  "epoch": 5.529091527730521,
-  "global_step": 65000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -1306,11 +1306,111 @@
       "eval_samples_per_second": 28.807,
       "eval_steps_per_second": 0.922,
       "step": 65000
     }
   ],
   "max_steps": 1000000,
   "num_train_epochs": 86,
-  "total_flos": 2.990133517637586e+21,
   "trial_name": null,
   "trial_params": null
 }

 {
   "best_metric": null,
   "best_model_checkpoint": null,
+  "epoch": 5.954406260632869,
+  "global_step": 70000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_samples_per_second": 28.807,
       "eval_steps_per_second": 0.922,
       "step": 65000
+    },
+    {
+      "epoch": 5.57,
+      "learning_rate": 9.999999999999999e-06,
+      "loss": 0.4078,
+      "step": 65500
+    },
+    {
+      "epoch": 5.61,
+      "learning_rate": 9.999999999999999e-06,
+      "loss": 0.4078,
+      "step": 66000
+    },
+    {
+      "epoch": 5.61,
+      "eval_loss": 0.3783106803894043,
+      "eval_runtime": 29.6676,
+      "eval_samples_per_second": 16.853,
+      "eval_steps_per_second": 0.539,
+      "step": 66000
+    },
+    {
+      "epoch": 5.66,
+      "learning_rate": 9.999999999999999e-06,
+      "loss": 0.4067,
+      "step": 66500
+    },
+    {
+      "epoch": 5.7,
+      "learning_rate": 9.999999999999999e-06,
+      "loss": 0.4072,
+      "step": 67000
+    },
+    {
+      "epoch": 5.7,
+      "eval_loss": 0.3780921399593353,
+      "eval_runtime": 15.2739,
+      "eval_samples_per_second": 32.736,
+      "eval_steps_per_second": 1.048,
+      "step": 67000
+    },
+    {
+      "epoch": 5.74,
+      "learning_rate": 9.999999999999999e-06,
+      "loss": 0.4079,
+      "step": 67500
+    },
+    {
+      "epoch": 5.78,
+      "learning_rate": 9.999999999999999e-06,
+      "loss": 0.4057,
+      "step": 68000
+    },
+    {
+      "epoch": 5.78,
+      "eval_loss": 0.37833890318870544,
+      "eval_runtime": 17.1263,
+      "eval_samples_per_second": 29.195,
+      "eval_steps_per_second": 0.934,
+      "step": 68000
+    },
+    {
+      "epoch": 5.83,
+      "learning_rate": 9.999999999999999e-06,
+      "loss": 0.406,
+      "step": 68500
+    },
+    {
+      "epoch": 5.87,
+      "learning_rate": 9.999999999999999e-06,
+      "loss": 0.4065,
+      "step": 69000
+    },
+    {
+      "epoch": 5.87,
+      "eval_loss": 0.37815991044044495,
+      "eval_runtime": 19.0772,
+      "eval_samples_per_second": 26.209,
+      "eval_steps_per_second": 0.839,
+      "step": 69000
+    },
+    {
+      "epoch": 5.91,
+      "learning_rate": 9.999999999999999e-06,
+      "loss": 0.4063,
+      "step": 69500
+    },
+    {
+      "epoch": 5.95,
+      "learning_rate": 9.999999999999999e-06,
+      "loss": 0.4062,
+      "step": 70000
+    },
+    {
+      "epoch": 5.95,
+      "eval_loss": 0.3770570158958435,
+      "eval_runtime": 15.6266,
+      "eval_samples_per_second": 31.997,
+      "eval_steps_per_second": 1.024,
+      "step": 70000
     }
   ],
   "max_steps": 1000000,
   "num_train_epochs": 86,
+  "total_flos": 3.2201500020403764e+21,
   "trial_name": null,
   "trial_params": null
 }

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:65f03d0e43e34a2e0bd81bc161f8b22fc6c59b8c9b7c6cda78db789b3b576cc9
 size 449471589

 version https://git-lfs.github.com/spec/v1
+oid sha256:c2aad4c0bf3fb0ed60689c461b583204b374f775ac8f21901c8280987af4fc28
 size 449471589