Training in progress, step 50000

Browse files

Files changed (7) hide show

last-checkpoint/optimizer.pt +1 -1
last-checkpoint/pytorch_model.bin +1 -1
last-checkpoint/rng_state.pth +1 -1
last-checkpoint/scaler.pt +1 -1
last-checkpoint/scheduler.pt +1 -1
last-checkpoint/trainer_state.json +103 -3
pytorch_model.bin +1 -1

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:974a1e790d3ca33c068dbaca3cc4297bfcbca347437b8b9cb62025728f09e96e
 size 893438545

 version https://git-lfs.github.com/spec/v1
+oid sha256:b95ce7bf4a9a70df03a869bfd8710fab6f0ef7693259e8c38b3126024cbebcc3
 size 893438545

last-checkpoint/pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:c5a9d277649a19c26574f85a21d72156907a1fa49083c31e96d8eb40d2455fc4
 size 449471589

 version https://git-lfs.github.com/spec/v1
+oid sha256:a3f8697a7005b7dc484714b01f5a75ae147ff94239fd18844849065bd12dec3d
 size 449471589

last-checkpoint/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:fe764e4b14b1a41f602255c5ad661b82e79519ef62fb0a01c7236478ec943d57
 size 15523

 version https://git-lfs.github.com/spec/v1
+oid sha256:ea06a30ae0f68fb2b00ec4bd1c46fefdb57836276b2fa0fd9ad846aef24b1782
 size 15523

last-checkpoint/scaler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a3c1e2756d4a4685b9df2f62aad4f5988b6c0b032f0fc7cb98d4e77d5c23a8e8
 size 559

 version https://git-lfs.github.com/spec/v1
+oid sha256:57478d8d6cf2ed1954106db902717d4bdc70029fbc5494696ebfea40753450a2
 size 559

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:584cc9786ad375313cf5cd3cfaf9ab2fa5956cf7f817f1132bf8fc5dbd46f871
 size 623

 version https://git-lfs.github.com/spec/v1
+oid sha256:9ae6cc6da9b6b4868c887a3704ca6ff92699322e28d657fc719a89a0a38b7bb6
 size 623

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
   "best_metric": null,
   "best_model_checkpoint": null,
-  "epoch": 3.8278325961211297,
-  "global_step": 45000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -906,11 +906,111 @@
       "eval_samples_per_second": 18.281,
       "eval_steps_per_second": 0.585,
       "step": 45000
     }
   ],
   "max_steps": 1000000,
   "num_train_epochs": 86,
-  "total_flos": 2.0700998918659003e+21,
   "trial_name": null,
   "trial_params": null
 }

 {
   "best_metric": null,
   "best_model_checkpoint": null,
+  "epoch": 4.253147329023477,
+  "global_step": 50000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_samples_per_second": 18.281,
       "eval_steps_per_second": 0.585,
       "step": 45000
+    },
+    {
+      "epoch": 3.87,
+      "learning_rate": 9.999999999999999e-06,
+      "loss": 0.4147,
+      "step": 45500
+    },
+    {
+      "epoch": 3.91,
+      "learning_rate": 9.999999999999999e-06,
+      "loss": 0.4145,
+      "step": 46000
+    },
+    {
+      "epoch": 3.91,
+      "eval_loss": 0.3854221701622009,
+      "eval_runtime": 27.205,
+      "eval_samples_per_second": 18.379,
+      "eval_steps_per_second": 0.588,
+      "step": 46000
+    },
+    {
+      "epoch": 3.96,
+      "learning_rate": 9.999999999999999e-06,
+      "loss": 0.4149,
+      "step": 46500
+    },
+    {
+      "epoch": 4.0,
+      "learning_rate": 9.999999999999999e-06,
+      "loss": 0.4143,
+      "step": 47000
+    },
+    {
+      "epoch": 4.0,
+      "eval_loss": 0.38265106081962585,
+      "eval_runtime": 26.169,
+      "eval_samples_per_second": 19.107,
+      "eval_steps_per_second": 0.611,
+      "step": 47000
+    },
+    {
+      "epoch": 4.04,
+      "learning_rate": 9.999999999999999e-06,
+      "loss": 0.4129,
+      "step": 47500
+    },
+    {
+      "epoch": 4.08,
+      "learning_rate": 9.999999999999999e-06,
+      "loss": 0.4144,
+      "step": 48000
+    },
+    {
+      "epoch": 4.08,
+      "eval_loss": 0.382869690656662,
+      "eval_runtime": 25.2103,
+      "eval_samples_per_second": 19.833,
+      "eval_steps_per_second": 0.635,
+      "step": 48000
+    },
+    {
+      "epoch": 4.13,
+      "learning_rate": 9.999999999999999e-06,
+      "loss": 0.4131,
+      "step": 48500
+    },
+    {
+      "epoch": 4.17,
+      "learning_rate": 9.999999999999999e-06,
+      "loss": 0.4147,
+      "step": 49000
+    },
+    {
+      "epoch": 4.17,
+      "eval_loss": 0.38291990756988525,
+      "eval_runtime": 36.6033,
+      "eval_samples_per_second": 13.66,
+      "eval_steps_per_second": 0.437,
+      "step": 49000
+    },
+    {
+      "epoch": 4.21,
+      "learning_rate": 9.999999999999999e-06,
+      "loss": 0.4125,
+      "step": 49500
+    },
+    {
+      "epoch": 4.25,
+      "learning_rate": 9.999999999999999e-06,
+      "loss": 0.4143,
+      "step": 50000
+    },
+    {
+      "epoch": 4.25,
+      "eval_loss": 0.3828723728656769,
+      "eval_runtime": 27.6434,
+      "eval_samples_per_second": 18.088,
+      "eval_steps_per_second": 0.579,
+      "step": 50000
     }
   ],
   "max_steps": 1000000,
   "num_train_epochs": 86,
+  "total_flos": 2.3001002203489527e+21,
   "trial_name": null,
   "trial_params": null
 }

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:c5a9d277649a19c26574f85a21d72156907a1fa49083c31e96d8eb40d2455fc4
 size 449471589

 version https://git-lfs.github.com/spec/v1
+oid sha256:a3f8697a7005b7dc484714b01f5a75ae147ff94239fd18844849065bd12dec3d
 size 449471589