Training in progress, step 100000

Browse files

Files changed (7) hide show

last-checkpoint/optimizer.pt +1 -1
last-checkpoint/pytorch_model.bin +1 -1
last-checkpoint/rng_state.pth +1 -1
last-checkpoint/scaler.pt +1 -1
last-checkpoint/scheduler.pt +1 -1
last-checkpoint/trainer_state.json +103 -3
pytorch_model.bin +1 -1

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:87faff5dd87328fcefec427ea0cb702408ad590c1646c0f7d82e8de25452a283
 size 893439185

 version https://git-lfs.github.com/spec/v1
+oid sha256:5de948cb6685f3fec4b4469fef2216abb64c3cc5c9fb4b44411eb5b1b0c73ba4
 size 893439185

last-checkpoint/pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:0479c3f6649af96b0cacdd70e8babe32246fd880992e4fd5742192a6d7c00e5d
 size 449471589

 version https://git-lfs.github.com/spec/v1
+oid sha256:207b689dc20acc0d2a0e375eb166e925399ce7d85ed5eab0492acb43daf3c3d7
 size 449471589

last-checkpoint/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:5ac2097dd35c516db233db35554b7dda10d7d27ccd52d7408994cce86d7c83aa
 size 15523

 version https://git-lfs.github.com/spec/v1
+oid sha256:3e5e0a7fe16308908e21fec293fc6a34f87d7d9cfe41576aecb2632ff5899d99
 size 15523

last-checkpoint/scaler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:74798da0c97f6f81c79c3a97ed18dc37829dc36f2e8346e520721378fc2c4935
 size 559

 version https://git-lfs.github.com/spec/v1
+oid sha256:24efe2e8f1d0c1484971647cd47d1b275b1dd217c12b20dd38b6583a6b5a8f76
 size 559

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:ef3a8846658935c38489fb3bdfd532e16ae98f8d1a9e1c24218ae3f20a78e624
 size 623

 version https://git-lfs.github.com/spec/v1
+oid sha256:2ecaf369939dc91fa10968935b06d43415e74dfc059ada323db7a2ef509df0e1
 size 623

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
   "best_metric": null,
   "best_model_checkpoint": null,
-  "epoch": 8.080979925144607,
-  "global_step": 95000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -1906,11 +1906,111 @@
       "eval_samples_per_second": 29.022,
       "eval_steps_per_second": 0.929,
       "step": 95000
     }
   ],
   "max_steps": 1000000,
   "num_train_epochs": 86,
-  "total_flos": 4.3701839562951146e+21,
   "trial_name": null,
   "trial_params": null
 }

 {
   "best_metric": null,
   "best_model_checkpoint": null,
+  "epoch": 8.506294658046954,
+  "global_step": 100000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_samples_per_second": 29.022,
       "eval_steps_per_second": 0.929,
       "step": 95000
+    },
+    {
+      "epoch": 8.12,
+      "learning_rate": 9.999999999999999e-06,
+      "loss": 0.3997,
+      "step": 95500
+    },
+    {
+      "epoch": 8.17,
+      "learning_rate": 9.999999999999999e-06,
+      "loss": 0.4024,
+      "step": 96000
+    },
+    {
+      "epoch": 8.17,
+      "eval_loss": 0.37120264768600464,
+      "eval_runtime": 16.2125,
+      "eval_samples_per_second": 30.84,
+      "eval_steps_per_second": 0.987,
+      "step": 96000
+    },
+    {
+      "epoch": 8.21,
+      "learning_rate": 9.999999999999999e-06,
+      "loss": 0.3997,
+      "step": 96500
+    },
+    {
+      "epoch": 8.25,
+      "learning_rate": 9.999999999999999e-06,
+      "loss": 0.402,
+      "step": 97000
+    },
+    {
+      "epoch": 8.25,
+      "eval_loss": 0.37261128425598145,
+      "eval_runtime": 16.3463,
+      "eval_samples_per_second": 30.588,
+      "eval_steps_per_second": 0.979,
+      "step": 97000
+    },
+    {
+      "epoch": 8.29,
+      "learning_rate": 9.999999999999999e-06,
+      "loss": 0.4004,
+      "step": 97500
+    },
+    {
+      "epoch": 8.34,
+      "learning_rate": 9.999999999999999e-06,
+      "loss": 0.4003,
+      "step": 98000
+    },
+    {
+      "epoch": 8.34,
+      "eval_loss": 0.37027257680892944,
+      "eval_runtime": 20.0807,
+      "eval_samples_per_second": 24.9,
+      "eval_steps_per_second": 0.797,
+      "step": 98000
+    },
+    {
+      "epoch": 8.38,
+      "learning_rate": 9.999999999999999e-06,
+      "loss": 0.4002,
+      "step": 98500
+    },
+    {
+      "epoch": 8.42,
+      "learning_rate": 9.999999999999999e-06,
+      "loss": 0.4007,
+      "step": 99000
+    },
+    {
+      "epoch": 8.42,
+      "eval_loss": 0.37140411138534546,
+      "eval_runtime": 21.4309,
+      "eval_samples_per_second": 23.331,
+      "eval_steps_per_second": 0.747,
+      "step": 99000
+    },
+    {
+      "epoch": 8.46,
+      "learning_rate": 9.999999999999999e-06,
+      "loss": 0.4,
+      "step": 99500
+    },
+    {
+      "epoch": 8.51,
+      "learning_rate": 9.999999999999999e-06,
+      "loss": 0.3997,
+      "step": 100000
+    },
+    {
+      "epoch": 8.51,
+      "eval_loss": 0.3693406283855438,
+      "eval_runtime": 17.2208,
+      "eval_samples_per_second": 29.035,
+      "eval_steps_per_second": 0.929,
+      "step": 100000
     }
   ],
   "max_steps": 1000000,
   "num_train_epochs": 86,
+  "total_flos": 4.600200440697905e+21,
   "trial_name": null,
   "trial_params": null
 }

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:0479c3f6649af96b0cacdd70e8babe32246fd880992e4fd5742192a6d7c00e5d
 size 449471589

 version https://git-lfs.github.com/spec/v1
+oid sha256:207b689dc20acc0d2a0e375eb166e925399ce7d85ed5eab0492acb43daf3c3d7
 size 449471589