Training in progress, step 90000

Browse files

Files changed (7) hide show

last-checkpoint/optimizer.pt +1 -1
last-checkpoint/pytorch_model.bin +1 -1
last-checkpoint/rng_state.pth +1 -1
last-checkpoint/scaler.pt +1 -1
last-checkpoint/scheduler.pt +1 -1
last-checkpoint/trainer_state.json +139 -3
pytorch_model.bin +1 -1

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:eb0ca75676c80a3c5fd59d0ac1080da68135ad1e20368aa04168b08561f3f84c
 size 893439185

 version https://git-lfs.github.com/spec/v1
+oid sha256:0946b4af042d0003be776279dd8dec310d85422ca12c683daea7163fdc14f58f
 size 893439185

last-checkpoint/pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:e5335ac4e09dbab38db400a30c96e423b02cd136b1548c7b0e7c7dba23f440f1
 size 449471589

 version https://git-lfs.github.com/spec/v1
+oid sha256:886c14bc146e35ddb8b43369943fdd5ae148eef1a89bed83206fbfc7c2a327ef
 size 449471589

last-checkpoint/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:211fb59b20f9f9f47cec52d841a7a8969719bf6f46a4a3c547f8fd9c6b81c01d
 size 15523

 version https://git-lfs.github.com/spec/v1
+oid sha256:f3ab37f55295b05256b0aeab0c9118d1e91676146a55f40c6459b8bea2a5ccfb
 size 15523

last-checkpoint/scaler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:41c9fe17fd2766bc47b158d8b9c3151501d7d3c0213ab927e2871c909d3a891a
 size 559

 version https://git-lfs.github.com/spec/v1
+oid sha256:7fd1d30ec6a85b35de8f6aedadaea7484a7f1c0d94891107a63ad388e3781007
 size 559

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:6997ee26ce92dcc6722ecbaf41fc375e207a59eb322cd715ff89e49540d1928e
 size 623

 version https://git-lfs.github.com/spec/v1
+oid sha256:f61de41cc564c25462ca0290993ffba1d92f72b28f091680e90a006d4be7a958
 size 623

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
   "best_metric": null,
   "best_model_checkpoint": null,
-  "epoch": 6.966820517286424,
-  "global_step": 80000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -1094,11 +1094,147 @@
       "eval_samples_per_second": 52.447,
       "eval_steps_per_second": 0.829,
       "step": 80000
     }
   ],
   "max_steps": 100000,
   "num_train_epochs": 9,
-  "total_flos": 3.767680420025334e+21,
   "trial_name": null,
   "trial_params": null
 }

 {
   "best_metric": null,
   "best_model_checkpoint": null,
+  "epoch": 7.8376730819472264,
+  "global_step": 90000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_samples_per_second": 52.447,
       "eval_steps_per_second": 0.829,
       "step": 80000
+    },
+    {
+      "epoch": 7.01,
+      "learning_rate": 1.827645001383699e-05,
+      "loss": 0.3851,
+      "step": 80500
+    },
+    {
+      "epoch": 7.05,
+      "learning_rate": 1.787137801463301e-05,
+      "loss": 0.3838,
+      "step": 81000
+    },
+    {
+      "epoch": 7.1,
+      "learning_rate": 1.7474742369683822e-05,
+      "loss": 0.3832,
+      "step": 81500
+    },
+    {
+      "epoch": 7.14,
+      "learning_rate": 1.7087461901426146e-05,
+      "loss": 0.3832,
+      "step": 82000
+    },
+    {
+      "epoch": 7.18,
+      "learning_rate": 1.670963216552051e-05,
+      "loss": 0.384,
+      "step": 82500
+    },
+    {
+      "epoch": 7.23,
+      "learning_rate": 1.6342073371699782e-05,
+      "loss": 0.3847,
+      "step": 83000
+    },
+    {
+      "epoch": 7.27,
+      "learning_rate": 1.5983403058409845e-05,
+      "loss": 0.3844,
+      "step": 83500
+    },
+    {
+      "epoch": 7.32,
+      "learning_rate": 1.5634455887471077e-05,
+      "loss": 0.384,
+      "step": 84000
+    },
+    {
+      "epoch": 7.36,
+      "learning_rate": 1.52953179563765e-05,
+      "loss": 0.3841,
+      "step": 84500
+    },
+    {
+      "epoch": 7.4,
+      "learning_rate": 1.496607294233597e-05,
+      "loss": 0.382,
+      "step": 85000
+    },
+    {
+      "epoch": 7.4,
+      "eval_loss": 0.3640451431274414,
+      "eval_runtime": 57.0081,
+      "eval_samples_per_second": 87.707,
+      "eval_steps_per_second": 1.386,
+      "step": 85000
+    },
+    {
+      "epoch": 7.45,
+      "learning_rate": 1.4646802081630117e-05,
+      "loss": 0.3827,
+      "step": 85500
+    },
+    {
+      "epoch": 7.49,
+      "learning_rate": 1.4337584149566472e-05,
+      "loss": 0.3821,
+      "step": 86000
+    },
+    {
+      "epoch": 7.53,
+      "learning_rate": 1.4039083460027203e-05,
+      "loss": 0.3829,
+      "step": 86500
+    },
+    {
+      "epoch": 7.58,
+      "learning_rate": 1.3750177292690856e-05,
+      "loss": 0.3827,
+      "step": 87000
+    },
+    {
+      "epoch": 7.62,
+      "learning_rate": 1.3472092247039123e-05,
+      "loss": 0.383,
+      "step": 87500
+    },
+    {
+      "epoch": 7.66,
+      "learning_rate": 1.3203782390038048e-05,
+      "loss": 0.3823,
+      "step": 88000
+    },
+    {
+      "epoch": 7.71,
+      "learning_rate": 1.2945881505195709e-05,
+      "loss": 0.3816,
+      "step": 88500
+    },
+    {
+      "epoch": 7.75,
+      "learning_rate": 1.2698453225696373e-05,
+      "loss": 0.381,
+      "step": 89000
+    },
+    {
+      "epoch": 7.79,
+      "learning_rate": 1.2461558600765676e-05,
+      "loss": 0.3809,
+      "step": 89500
+    },
+    {
+      "epoch": 7.84,
+      "learning_rate": 1.2235256080607583e-05,
+      "loss": 0.3806,
+      "step": 90000
+    },
+    {
+      "epoch": 7.84,
+      "eval_loss": 0.36302754282951355,
+      "eval_runtime": 77.3446,
+      "eval_samples_per_second": 64.646,
+      "eval_steps_per_second": 1.021,
+      "step": 90000
     }
   ],
   "max_steps": 100000,
   "num_train_epochs": 9,
+  "total_flos": 4.238631778453049e+21,
   "trial_name": null,
   "trial_params": null
 }

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:e5335ac4e09dbab38db400a30c96e423b02cd136b1548c7b0e7c7dba23f440f1
 size 449471589

 version https://git-lfs.github.com/spec/v1
+oid sha256:886c14bc146e35ddb8b43369943fdd5ae148eef1a89bed83206fbfc7c2a327ef
 size 449471589