Training in progress, step 10000

Browse files

Files changed (7) hide show

last-checkpoint/optimizer.pt +1 -1
last-checkpoint/pytorch_model.bin +1 -1
last-checkpoint/rng_state.pth +1 -1
last-checkpoint/scaler.pt +1 -1
last-checkpoint/scheduler.pt +1 -1
last-checkpoint/trainer_state.json +103 -3
pytorch_model.bin +1 -1

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a4d1ae83eac6be8f8c2b954c370c8aeadc7267bda680236a7a24a7649af5362c
 size 893438545

 version https://git-lfs.github.com/spec/v1
+oid sha256:d1d7732285dbc0e8407195393ce8d0f6d70acf3e85a7b4ef3f39c8609146bc0b
 size 893438545

last-checkpoint/pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a0baba8b4569c45a203ea379a2bd3967765a89b7b77984726e0ce3ce542327d3
 size 449471589

 version https://git-lfs.github.com/spec/v1
+oid sha256:d2b9950baa41cad72de72ff958a3f0b3caf4baaab2ba0b7beec4ae2bb74a2a62
 size 449471589

last-checkpoint/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:b67640377e5e9bee3b80f7da077f845affe0a102a4d4e09d30cfa4a924a22956
 size 15523

 version https://git-lfs.github.com/spec/v1
+oid sha256:a5d6b04968c3393a8d3fcd8486073945737f454dd868c26cd51d9e51b95e0e1f
 size 15523

last-checkpoint/scaler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:dba64a6270ae61fb92642c233ac6acc0599e93af9e8dc843c1040d701d07852c
 size 559

 version https://git-lfs.github.com/spec/v1
+oid sha256:eec59b704dede5fd2cb3547af4da160bc4d245b31d03184f1306b83b75cd8e19
 size 559

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:f84d441103b80fa19700bab6a191373aa187c4bff502da3579fb8fa36762b6ca
 size 623

 version https://git-lfs.github.com/spec/v1
+oid sha256:68906a5e3db4424f18aed3a659657b33e5a4636dccdcb491f81ba7b3cc4c516d
 size 623

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
   "best_metric": null,
   "best_model_checkpoint": null,
-  "epoch": 0.4253147329023477,
-  "global_step": 5000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -106,11 +106,111 @@
       "eval_samples_per_second": 24.61,
       "eval_steps_per_second": 0.788,
       "step": 5000
     }
   ],
   "max_steps": 1000000,
   "num_train_epochs": 86,
-  "total_flos": 2.300164844027904e+20,
   "trial_name": null,
   "trial_params": null
 }

 {
   "best_metric": null,
   "best_model_checkpoint": null,
+  "epoch": 0.8506294658046955,
+  "global_step": 10000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_samples_per_second": 24.61,
       "eval_steps_per_second": 0.788,
       "step": 5000
+    },
+    {
+      "epoch": 0.47,
+      "learning_rate": 9.999999999999999e-06,
+      "loss": 0.4588,
+      "step": 5500
+    },
+    {
+      "epoch": 0.51,
+      "learning_rate": 9.999999999999999e-06,
+      "loss": 0.4567,
+      "step": 6000
+    },
+    {
+      "epoch": 0.51,
+      "eval_loss": 0.4276145100593567,
+      "eval_runtime": 16.3756,
+      "eval_samples_per_second": 30.533,
+      "eval_steps_per_second": 0.977,
+      "step": 6000
+    },
+    {
+      "epoch": 0.55,
+      "learning_rate": 9.999999999999999e-06,
+      "loss": 0.4549,
+      "step": 6500
+    },
+    {
+      "epoch": 0.6,
+      "learning_rate": 9.999999999999999e-06,
+      "loss": 0.4527,
+      "step": 7000
+    },
+    {
+      "epoch": 0.6,
+      "eval_loss": 0.42289844155311584,
+      "eval_runtime": 15.9391,
+      "eval_samples_per_second": 31.369,
+      "eval_steps_per_second": 1.004,
+      "step": 7000
+    },
+    {
+      "epoch": 0.64,
+      "learning_rate": 9.999999999999999e-06,
+      "loss": 0.4523,
+      "step": 7500
+    },
+    {
+      "epoch": 0.68,
+      "learning_rate": 9.999999999999999e-06,
+      "loss": 0.4504,
+      "step": 8000
+    },
+    {
+      "epoch": 0.68,
+      "eval_loss": 0.4213045537471771,
+      "eval_runtime": 15.5457,
+      "eval_samples_per_second": 32.163,
+      "eval_steps_per_second": 1.029,
+      "step": 8000
+    },
+    {
+      "epoch": 0.72,
+      "learning_rate": 9.999999999999999e-06,
+      "loss": 0.449,
+      "step": 8500
+    },
+    {
+      "epoch": 0.77,
+      "learning_rate": 9.999999999999999e-06,
+      "loss": 0.4473,
+      "step": 9000
+    },
+    {
+      "epoch": 0.77,
+      "eval_loss": 0.41637736558914185,
+      "eval_runtime": 15.7487,
+      "eval_samples_per_second": 31.749,
+      "eval_steps_per_second": 1.016,
+      "step": 9000
+    },
+    {
+      "epoch": 0.81,
+      "learning_rate": 9.999999999999999e-06,
+      "loss": 0.4468,
+      "step": 9500
+    },
+    {
+      "epoch": 0.85,
+      "learning_rate": 9.999999999999999e-06,
+      "loss": 0.4447,
+      "step": 10000
+    },
+    {
+      "epoch": 0.85,
+      "eval_loss": 0.4148881733417511,
+      "eval_runtime": 15.3622,
+      "eval_samples_per_second": 32.547,
+      "eval_steps_per_second": 1.042,
+      "step": 10000
     }
   ],
   "max_steps": 1000000,
   "num_train_epochs": 86,
+  "total_flos": 4.600329688055808e+20,
   "trial_name": null,
   "trial_params": null
 }

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a0baba8b4569c45a203ea379a2bd3967765a89b7b77984726e0ce3ce542327d3
 size 449471589

 version https://git-lfs.github.com/spec/v1
+oid sha256:d2b9950baa41cad72de72ff958a3f0b3caf4baaab2ba0b7beec4ae2bb74a2a62
 size 449471589