Training in progress, step 75000

Browse files

Files changed (7) hide show

last-checkpoint/optimizer.pt +1 -1
last-checkpoint/pytorch_model.bin +1 -1
last-checkpoint/rng_state.pth +1 -1
last-checkpoint/scaler.pt +1 -1
last-checkpoint/scheduler.pt +1 -1
last-checkpoint/trainer_state.json +103 -3
pytorch_model.bin +1 -1

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:058e818841dd5d8551bdb702bf79c2919a18608fe8d04e481344ab6a9d437053
 size 893439185

 version https://git-lfs.github.com/spec/v1
+oid sha256:94c42a01b552543e62a3944c3187b9f2d5e5e9bc4078dc1a017356ad2f7dc004
 size 893439185

last-checkpoint/pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:c2aad4c0bf3fb0ed60689c461b583204b374f775ac8f21901c8280987af4fc28
 size 449471589

 version https://git-lfs.github.com/spec/v1
+oid sha256:9ad209d089c4737fe935a630c9bedf910da9516f82f0d1d863ad0c840e926ffa
 size 449471589

last-checkpoint/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:4674bdfc2111c4be2d53fed27a1a59d3f54df49666b8123e70941223006d6b1b
 size 15523

 version https://git-lfs.github.com/spec/v1
+oid sha256:19a6bae5be3d123d40565035db3477df4ba95d519abfda9013e7b522c94cbc53
 size 15523

last-checkpoint/scaler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:62e6a5cc3a60f7141da7f18b69a3a13de9f897b3f440b905c0f70fda71c091a5
 size 559

 version https://git-lfs.github.com/spec/v1
+oid sha256:134046d1fefbeeafed77a6a1deaac9436322f5bf920a26c3d8ece634cccfe3e9
 size 559

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:e2a44e614402fafbcde75b77e1a195abb137e3c2b1958a6d75361c958ced8160
 size 623

 version https://git-lfs.github.com/spec/v1
+oid sha256:be8308decf673b01fae26328e1125d69008a8fd59ea958321bb3e87e2ca217de
 size 623

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
   "best_metric": null,
   "best_model_checkpoint": null,
-  "epoch": 5.954406260632869,
-  "global_step": 70000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -1406,11 +1406,111 @@
       "eval_samples_per_second": 31.997,
       "eval_steps_per_second": 1.024,
       "step": 70000
     }
   ],
   "max_steps": 1000000,
   "num_train_epochs": 86,
-  "total_flos": 3.2201500020403764e+21,
   "trial_name": null,
   "trial_params": null
 }

 {
   "best_metric": null,
   "best_model_checkpoint": null,
+  "epoch": 6.379720993535216,
+  "global_step": 75000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_samples_per_second": 31.997,
       "eval_steps_per_second": 1.024,
       "step": 70000
+    },
+    {
+      "epoch": 6.0,
+      "learning_rate": 9.999999999999999e-06,
+      "loss": 0.4073,
+      "step": 70500
+    },
+    {
+      "epoch": 6.04,
+      "learning_rate": 9.999999999999999e-06,
+      "loss": 0.4051,
+      "step": 71000
+    },
+    {
+      "epoch": 6.04,
+      "eval_loss": 0.3775251507759094,
+      "eval_runtime": 16.0318,
+      "eval_samples_per_second": 31.188,
+      "eval_steps_per_second": 0.998,
+      "step": 71000
+    },
+    {
+      "epoch": 6.08,
+      "learning_rate": 9.999999999999999e-06,
+      "loss": 0.4066,
+      "step": 71500
+    },
+    {
+      "epoch": 6.12,
+      "learning_rate": 9.999999999999999e-06,
+      "loss": 0.4057,
+      "step": 72000
+    },
+    {
+      "epoch": 6.12,
+      "eval_loss": 0.37701237201690674,
+      "eval_runtime": 15.6982,
+      "eval_samples_per_second": 31.851,
+      "eval_steps_per_second": 1.019,
+      "step": 72000
+    },
+    {
+      "epoch": 6.17,
+      "learning_rate": 9.999999999999999e-06,
+      "loss": 0.4067,
+      "step": 72500
+    },
+    {
+      "epoch": 6.21,
+      "learning_rate": 9.999999999999999e-06,
+      "loss": 0.4061,
+      "step": 73000
+    },
+    {
+      "epoch": 6.21,
+      "eval_loss": 0.37806421518325806,
+      "eval_runtime": 15.7852,
+      "eval_samples_per_second": 31.675,
+      "eval_steps_per_second": 1.014,
+      "step": 73000
+    },
+    {
+      "epoch": 6.25,
+      "learning_rate": 9.999999999999999e-06,
+      "loss": 0.4053,
+      "step": 73500
+    },
+    {
+      "epoch": 6.29,
+      "learning_rate": 9.999999999999999e-06,
+      "loss": 0.405,
+      "step": 74000
+    },
+    {
+      "epoch": 6.29,
+      "eval_loss": 0.3771826922893524,
+      "eval_runtime": 15.5158,
+      "eval_samples_per_second": 32.225,
+      "eval_steps_per_second": 1.031,
+      "step": 74000
+    },
+    {
+      "epoch": 6.34,
+      "learning_rate": 9.999999999999999e-06,
+      "loss": 0.4064,
+      "step": 74500
+    },
+    {
+      "epoch": 6.38,
+      "learning_rate": 9.999999999999999e-06,
+      "loss": 0.4053,
+      "step": 75000
+    },
+    {
+      "epoch": 6.38,
+      "eval_loss": 0.377290278673172,
+      "eval_runtime": 23.3698,
+      "eval_samples_per_second": 21.395,
+      "eval_steps_per_second": 0.685,
+      "step": 75000
     }
   ],
   "max_steps": 1000000,
   "num_train_epochs": 86,
+  "total_flos": 3.450150330523429e+21,
   "trial_name": null,
   "trial_params": null
 }

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:c2aad4c0bf3fb0ed60689c461b583204b374f775ac8f21901c8280987af4fc28
 size 449471589

 version https://git-lfs.github.com/spec/v1
+oid sha256:9ad209d089c4737fe935a630c9bedf910da9516f82f0d1d863ad0c840e926ffa
 size 449471589