Training in progress, step 70000

Browse files

Files changed (7) hide show

last-checkpoint/optimizer.pt +2 -2
last-checkpoint/pytorch_model.bin +1 -1
last-checkpoint/rng_state.pth +1 -1
last-checkpoint/scaler.pt +1 -1
last-checkpoint/scheduler.pt +1 -1
last-checkpoint/trainer_state.json +139 -3
pytorch_model.bin +1 -1

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:75f490a44ca4db15e7575b8b5617b1840dd0ecf21419611f63f02b99abb69e9b
-size 893438545

 version https://git-lfs.github.com/spec/v1
+oid sha256:fa88874d16a939070903a93d5ba329854e46aadf2f7f7ea1a61905c517a19385
+size 893439185

last-checkpoint/pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:27d58b7a9a0b285b885c546e3dfb7edd5e2459a83480dfbe8cb380fa08f7c48b
 size 449471589

 version https://git-lfs.github.com/spec/v1
+oid sha256:7df44f87e5182a482c9b6d3a619d67eba073218906e5c075beb6e29b9896b503
 size 449471589

last-checkpoint/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:40154e4835e4b0b561c3bf4ff2dc5bc26aeff6d6da324651140e34885d603328
 size 15523

 version https://git-lfs.github.com/spec/v1
+oid sha256:c007293227ea685a1b33f33dc58e5de97e57e2743aa81629ff6475f1a3723ca2
 size 15523

last-checkpoint/scaler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:f6b7e341561c3473a840ee99225858db17d1117cb5b96bd811d9778b3f6e2cd9
 size 559

 version https://git-lfs.github.com/spec/v1
+oid sha256:2a7310bd5c1439c4bb35c49bf02221c2d3a79d6f2845dd008a516ce1038c5377
 size 559

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:621aa918e7d94e76e980dd52e6d602b019ed8ae919fe1ca65a5ac903747bec67
 size 623

 version https://git-lfs.github.com/spec/v1
+oid sha256:069e42e1515a55f52067d0327eb65014273d332079adda47ed8ce25758c61f85
 size 623

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
   "best_metric": null,
   "best_model_checkpoint": null,
-  "epoch": 5.225115387964817,
-  "global_step": 60000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -822,11 +822,147 @@
       "eval_samples_per_second": 54.961,
       "eval_steps_per_second": 0.868,
       "step": 60000
     }
   ],
   "max_steps": 100000,
   "num_train_epochs": 9,
-  "total_flos": 2.8257429268680965e+21,
   "trial_name": null,
   "trial_params": null
 }

 {
   "best_metric": null,
   "best_model_checkpoint": null,
+  "epoch": 6.09596795262562,
+  "global_step": 70000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_samples_per_second": 54.961,
       "eval_steps_per_second": 0.868,
       "step": 60000
+    },
+    {
+      "epoch": 5.27,
+      "learning_rate": 4.0717494800280484e-05,
+      "loss": 0.3985,
+      "step": 60500
+    },
+    {
+      "epoch": 5.31,
+      "learning_rate": 4.0044619833152034e-05,
+      "loss": 0.3961,
+      "step": 61000
+    },
+    {
+      "epoch": 5.36,
+      "learning_rate": 3.937553126317129e-05,
+      "loss": 0.397,
+      "step": 61500
+    },
+    {
+      "epoch": 5.4,
+      "learning_rate": 3.871039417793112e-05,
+      "loss": 0.3957,
+      "step": 62000
+    },
+    {
+      "epoch": 5.44,
+      "learning_rate": 3.804937269005464e-05,
+      "loss": 0.3943,
+      "step": 62500
+    },
+    {
+      "epoch": 5.49,
+      "learning_rate": 3.7392629896702916e-05,
+      "loss": 0.3946,
+      "step": 63000
+    },
+    {
+      "epoch": 5.53,
+      "learning_rate": 3.674032783933316e-05,
+      "loss": 0.3951,
+      "step": 63500
+    },
+    {
+      "epoch": 5.57,
+      "learning_rate": 3.609262746371739e-05,
+      "loss": 0.3947,
+      "step": 64000
+    },
+    {
+      "epoch": 5.62,
+      "learning_rate": 3.544968858023156e-05,
+      "loss": 0.3942,
+      "step": 64500
+    },
+    {
+      "epoch": 5.66,
+      "learning_rate": 3.481294084680979e-05,
+      "loss": 0.3935,
+      "step": 65000
+    },
+    {
+      "epoch": 5.66,
+      "eval_loss": 0.3747362196445465,
+      "eval_runtime": 73.821,
+      "eval_samples_per_second": 67.731,
+      "eval_steps_per_second": 1.07,
+      "step": 65000
+    },
+    {
+      "epoch": 5.7,
+      "learning_rate": 3.417998932888398e-05,
+      "loss": 0.3928,
+      "step": 65500
+    },
+    {
+      "epoch": 5.75,
+      "learning_rate": 3.3552271217928446e-05,
+      "loss": 0.3931,
+      "step": 66000
+    },
+    {
+      "epoch": 5.79,
+      "learning_rate": 3.292994139399436e-05,
+      "loss": 0.3917,
+      "step": 66500
+    },
+    {
+      "epoch": 5.83,
+      "learning_rate": 3.231438135148965e-05,
+      "loss": 0.3915,
+      "step": 67000
+    },
+    {
+      "epoch": 5.88,
+      "learning_rate": 3.170327584695585e-05,
+      "loss": 0.392,
+      "step": 67500
+    },
+    {
+      "epoch": 5.92,
+      "learning_rate": 3.1098014841384136e-05,
+      "loss": 0.3912,
+      "step": 68000
+    },
+    {
+      "epoch": 5.97,
+      "learning_rate": 3.0498747673870948e-05,
+      "loss": 0.3913,
+      "step": 68500
+    },
+    {
+      "epoch": 6.01,
+      "learning_rate": 2.9905622204622832e-05,
+      "loss": 0.3912,
+      "step": 69000
+    },
+    {
+      "epoch": 6.05,
+      "learning_rate": 2.9318784778474186e-05,
+      "loss": 0.3898,
+      "step": 69500
+    },
+    {
+      "epoch": 6.1,
+      "learning_rate": 2.8738380188778874e-05,
+      "loss": 0.3901,
+      "step": 70000
+    },
+    {
+      "epoch": 6.1,
+      "eval_loss": 0.37070053815841675,
+      "eval_runtime": 53.0932,
+      "eval_samples_per_second": 94.174,
+      "eval_steps_per_second": 1.488,
+      "step": 70000
     }
   ],
   "max_steps": 100000,
   "num_train_epochs": 9,
+  "total_flos": 3.296694285295811e+21,
   "trial_name": null,
   "trial_params": null
 }

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:27d58b7a9a0b285b885c546e3dfb7edd5e2459a83480dfbe8cb380fa08f7c48b
 size 449471589

 version https://git-lfs.github.com/spec/v1
+oid sha256:7df44f87e5182a482c9b6d3a619d67eba073218906e5c075beb6e29b9896b503
 size 449471589