Training in progress, step 15000

Browse files

Files changed (7) hide show

last-checkpoint/optimizer.pt +1 -1
last-checkpoint/pytorch_model.bin +1 -1
last-checkpoint/rng_state.pth +1 -1
last-checkpoint/scaler.pt +1 -1
last-checkpoint/scheduler.pt +1 -1
last-checkpoint/trainer_state.json +103 -3
pytorch_model.bin +1 -1

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:d1d7732285dbc0e8407195393ce8d0f6d70acf3e85a7b4ef3f39c8609146bc0b
 size 893438545

 version https://git-lfs.github.com/spec/v1
+oid sha256:74b1c9f89c10be34ba07b732580d1baf51bcc9628d8b3575e180ec708de685c5
 size 893438545

last-checkpoint/pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:d2b9950baa41cad72de72ff958a3f0b3caf4baaab2ba0b7beec4ae2bb74a2a62
 size 449471589

 version https://git-lfs.github.com/spec/v1
+oid sha256:ee2ea420baca9d2eefcc8dae7100675a88105c3d9e9c3b79b36e00445ccc4ead
 size 449471589

last-checkpoint/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a5d6b04968c3393a8d3fcd8486073945737f454dd868c26cd51d9e51b95e0e1f
 size 15523

 version https://git-lfs.github.com/spec/v1
+oid sha256:7226249c7c6eefd4928af13e408fa71684763a62cddcee1deb41b978d9e6dc31
 size 15523

last-checkpoint/scaler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:eec59b704dede5fd2cb3547af4da160bc4d245b31d03184f1306b83b75cd8e19
 size 559

 version https://git-lfs.github.com/spec/v1
+oid sha256:a580bf3efb9f384c93dd5a88430e23ca8962352ab2092b0d242ef512ae2fd496
 size 559

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:68906a5e3db4424f18aed3a659657b33e5a4636dccdcb491f81ba7b3cc4c516d
 size 623

 version https://git-lfs.github.com/spec/v1
+oid sha256:b55c5d2c495ac51faf1cace6b3a1c40da89146b1ba80937cb1f531c05bc48c91
 size 623

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
   "best_metric": null,
   "best_model_checkpoint": null,
-  "epoch": 0.8506294658046955,
-  "global_step": 10000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -206,11 +206,111 @@
       "eval_samples_per_second": 32.547,
       "eval_steps_per_second": 1.042,
       "step": 10000
     }
   ],
   "max_steps": 1000000,
   "num_train_epochs": 86,
-  "total_flos": 4.600329688055808e+20,
   "trial_name": null,
   "trial_params": null
 }

 {
   "best_metric": null,
   "best_model_checkpoint": null,
+  "epoch": 1.2759441987070432,
+  "global_step": 15000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_samples_per_second": 32.547,
       "eval_steps_per_second": 1.042,
       "step": 10000
+    },
+    {
+      "epoch": 0.89,
+      "learning_rate": 9.999999999999999e-06,
+      "loss": 0.4437,
+      "step": 10500
+    },
+    {
+      "epoch": 0.94,
+      "learning_rate": 9.999999999999999e-06,
+      "loss": 0.4433,
+      "step": 11000
+    },
+    {
+      "epoch": 0.94,
+      "eval_loss": 0.4144207835197449,
+      "eval_runtime": 30.4128,
+      "eval_samples_per_second": 16.44,
+      "eval_steps_per_second": 0.526,
+      "step": 11000
+    },
+    {
+      "epoch": 0.98,
+      "learning_rate": 9.999999999999999e-06,
+      "loss": 0.4431,
+      "step": 11500
+    },
+    {
+      "epoch": 1.02,
+      "learning_rate": 9.999999999999999e-06,
+      "loss": 0.4413,
+      "step": 12000
+    },
+    {
+      "epoch": 1.02,
+      "eval_loss": 0.4120546877384186,
+      "eval_runtime": 14.9708,
+      "eval_samples_per_second": 33.398,
+      "eval_steps_per_second": 1.069,
+      "step": 12000
+    },
+    {
+      "epoch": 1.06,
+      "learning_rate": 9.999999999999999e-06,
+      "loss": 0.4401,
+      "step": 12500
+    },
+    {
+      "epoch": 1.11,
+      "learning_rate": 9.999999999999999e-06,
+      "loss": 0.4395,
+      "step": 13000
+    },
+    {
+      "epoch": 1.11,
+      "eval_loss": 0.40858784317970276,
+      "eval_runtime": 16.4691,
+      "eval_samples_per_second": 30.36,
+      "eval_steps_per_second": 0.972,
+      "step": 13000
+    },
+    {
+      "epoch": 1.15,
+      "learning_rate": 9.999999999999999e-06,
+      "loss": 0.4411,
+      "step": 13500
+    },
+    {
+      "epoch": 1.19,
+      "learning_rate": 9.999999999999999e-06,
+      "loss": 0.4391,
+      "step": 14000
+    },
+    {
+      "epoch": 1.19,
+      "eval_loss": 0.40859168767929077,
+      "eval_runtime": 16.6715,
+      "eval_samples_per_second": 29.991,
+      "eval_steps_per_second": 0.96,
+      "step": 14000
+    },
+    {
+      "epoch": 1.23,
+      "learning_rate": 9.999999999999999e-06,
+      "loss": 0.4385,
+      "step": 14500
+    },
+    {
+      "epoch": 1.28,
+      "learning_rate": 9.999999999999999e-06,
+      "loss": 0.4371,
+      "step": 15000
+    },
+    {
+      "epoch": 1.28,
+      "eval_loss": 0.4050961434841156,
+      "eval_runtime": 14.6709,
+      "eval_samples_per_second": 34.081,
+      "eval_steps_per_second": 1.091,
+      "step": 15000
     }
   ],
   "max_steps": 1000000,
   "num_train_epochs": 86,
+  "total_flos": 6.900332972886334e+20,
   "trial_name": null,
   "trial_params": null
 }

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:d2b9950baa41cad72de72ff958a3f0b3caf4baaab2ba0b7beec4ae2bb74a2a62
 size 449471589

 version https://git-lfs.github.com/spec/v1
+oid sha256:ee2ea420baca9d2eefcc8dae7100675a88105c3d9e9c3b79b36e00445ccc4ead
 size 449471589