Training in progress, step 95000

Browse files

Files changed (7) hide show

last-checkpoint/optimizer.pt +1 -1
last-checkpoint/pytorch_model.bin +1 -1
last-checkpoint/rng_state.pth +1 -1
last-checkpoint/scaler.pt +1 -1
last-checkpoint/scheduler.pt +1 -1
last-checkpoint/trainer_state.json +103 -3
pytorch_model.bin +1 -1

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:14d8d23556dde86498d9bec72b8d91249dd67487020ee43ffaba2d4a9670c816
 size 893439185

 version https://git-lfs.github.com/spec/v1
+oid sha256:87faff5dd87328fcefec427ea0cb702408ad590c1646c0f7d82e8de25452a283
 size 893439185

last-checkpoint/pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:280e3b8af6c535b6231490cffafeefbe7d58fc21536c2088588347c8f50e536d
 size 449471589

 version https://git-lfs.github.com/spec/v1
+oid sha256:0479c3f6649af96b0cacdd70e8babe32246fd880992e4fd5742192a6d7c00e5d
 size 449471589

last-checkpoint/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:ac83572cac812d05eb9798aaa4eeb4ec6a277964f63a5c6414ba65bbee7b2879
 size 15523

 version https://git-lfs.github.com/spec/v1
+oid sha256:5ac2097dd35c516db233db35554b7dda10d7d27ccd52d7408994cce86d7c83aa
 size 15523

last-checkpoint/scaler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:faa0eac9b0ca6f76b1a38ea18d17cb1c00d76f583a4c4c949f12c073b7c172f0
 size 559

 version https://git-lfs.github.com/spec/v1
+oid sha256:74798da0c97f6f81c79c3a97ed18dc37829dc36f2e8346e520721378fc2c4935
 size 559

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:fb667bcf48468e7c33d6bd49b2f45e30dd3d0f2a562e310780db60a92c6b3333
 size 623

 version https://git-lfs.github.com/spec/v1
+oid sha256:ef3a8846658935c38489fb3bdfd532e16ae98f8d1a9e1c24218ae3f20a78e624
 size 623

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
   "best_metric": null,
   "best_model_checkpoint": null,
-  "epoch": 7.655665192242259,
-  "global_step": 90000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -1806,11 +1806,111 @@
       "eval_samples_per_second": 30.652,
       "eval_steps_per_second": 0.981,
       "step": 90000
     }
   ],
   "max_steps": 1000000,
   "num_train_epochs": 86,
-  "total_flos": 4.140183627812062e+21,
   "trial_name": null,
   "trial_params": null
 }

 {
   "best_metric": null,
   "best_model_checkpoint": null,
+  "epoch": 8.080979925144607,
+  "global_step": 95000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_samples_per_second": 30.652,
       "eval_steps_per_second": 0.981,
       "step": 90000
+    },
+    {
+      "epoch": 7.7,
+      "learning_rate": 9.999999999999999e-06,
+      "loss": 0.4017,
+      "step": 90500
+    },
+    {
+      "epoch": 7.74,
+      "learning_rate": 9.999999999999999e-06,
+      "loss": 0.4016,
+      "step": 91000
+    },
+    {
+      "epoch": 7.74,
+      "eval_loss": 0.3734327256679535,
+      "eval_runtime": 17.5409,
+      "eval_samples_per_second": 28.505,
+      "eval_steps_per_second": 0.912,
+      "step": 91000
+    },
+    {
+      "epoch": 7.78,
+      "learning_rate": 9.999999999999999e-06,
+      "loss": 0.3998,
+      "step": 91500
+    },
+    {
+      "epoch": 7.83,
+      "learning_rate": 9.999999999999999e-06,
+      "loss": 0.4006,
+      "step": 92000
+    },
+    {
+      "epoch": 7.83,
+      "eval_loss": 0.3747243583202362,
+      "eval_runtime": 17.4755,
+      "eval_samples_per_second": 28.611,
+      "eval_steps_per_second": 0.916,
+      "step": 92000
+    },
+    {
+      "epoch": 7.87,
+      "learning_rate": 9.999999999999999e-06,
+      "loss": 0.4013,
+      "step": 92500
+    },
+    {
+      "epoch": 7.91,
+      "learning_rate": 9.999999999999999e-06,
+      "loss": 0.4008,
+      "step": 93000
+    },
+    {
+      "epoch": 7.91,
+      "eval_loss": 0.37303251028060913,
+      "eval_runtime": 17.0856,
+      "eval_samples_per_second": 29.264,
+      "eval_steps_per_second": 0.936,
+      "step": 93000
+    },
+    {
+      "epoch": 7.95,
+      "learning_rate": 9.999999999999999e-06,
+      "loss": 0.4008,
+      "step": 93500
+    },
+    {
+      "epoch": 8.0,
+      "learning_rate": 9.999999999999999e-06,
+      "loss": 0.402,
+      "step": 94000
+    },
+    {
+      "epoch": 8.0,
+      "eval_loss": 0.37281692028045654,
+      "eval_runtime": 17.9894,
+      "eval_samples_per_second": 27.794,
+      "eval_steps_per_second": 0.889,
+      "step": 94000
+    },
+    {
+      "epoch": 8.04,
+      "learning_rate": 9.999999999999999e-06,
+      "loss": 0.4005,
+      "step": 94500
+    },
+    {
+      "epoch": 8.08,
+      "learning_rate": 9.999999999999999e-06,
+      "loss": 0.4008,
+      "step": 95000
+    },
+    {
+      "epoch": 8.08,
+      "eval_loss": 0.37092164158821106,
+      "eval_runtime": 17.2285,
+      "eval_samples_per_second": 29.022,
+      "eval_steps_per_second": 0.929,
+      "step": 95000
     }
   ],
   "max_steps": 1000000,
   "num_train_epochs": 86,
+  "total_flos": 4.3701839562951146e+21,
   "trial_name": null,
   "trial_params": null
 }

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:280e3b8af6c535b6231490cffafeefbe7d58fc21536c2088588347c8f50e536d
 size 449471589

 version https://git-lfs.github.com/spec/v1
+oid sha256:0479c3f6649af96b0cacdd70e8babe32246fd880992e4fd5742192a6d7c00e5d
 size 449471589