Training in progress, step 60000

Browse files

Files changed (7) hide show

last-checkpoint/optimizer.pt +1 -1
last-checkpoint/pytorch_model.bin +1 -1
last-checkpoint/rng_state.pth +1 -1
last-checkpoint/scaler.pt +1 -1
last-checkpoint/scheduler.pt +1 -1
last-checkpoint/trainer_state.json +103 -3
pytorch_model.bin +1 -1

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:498d7b9e3f0d37a83926f59b2cb165bdd46bd0c0742c54170b76d952e02a893c
 size 893438545

 version https://git-lfs.github.com/spec/v1
+oid sha256:abf4891b4d7d549b998893b34a4d7fda74fe4d926dd8829b0fd1f3ebe9e05331
 size 893438545

last-checkpoint/pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:f33e96cd5ae96ee1eef3ce16c2a488ea23ed489c465e68987d362841b961f8c8
 size 449471589

 version https://git-lfs.github.com/spec/v1
+oid sha256:18a2bbc1e1a7ffff89dca088c920d657df7faf45dedf18ccd7ee5e4d0208668c
 size 449471589

last-checkpoint/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:7d4c51ae1618ba1804c8e334fa9d680770c5a033bbae09ba0b6215394af3efe5
 size 15523

 version https://git-lfs.github.com/spec/v1
+oid sha256:6674133d74344ac7df609ac13da3436a0f3992a815e6582851a68fd5a7ad5e18
 size 15523

last-checkpoint/scaler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:79bb4f1c3cf2bd9538fe3d60ad5d10def453ecc1e22bfde183478867d351d65b
 size 559

 version https://git-lfs.github.com/spec/v1
+oid sha256:337ac944c1300b5fad5b6313f7b0d4a29d6bf7750594a32866e96847ec6ec635
 size 559

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:57c4a8546e1f655ebc7fedb20c5c49b5e1c8e9f57c8fc9fd75e9a0ca2f699d21
 size 623

 version https://git-lfs.github.com/spec/v1
+oid sha256:19d585522f5a4f4e47c69e3dfd034779da400358487b840d5af1cf4b0f318c1e
 size 623

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
   "best_metric": null,
   "best_model_checkpoint": null,
-  "epoch": 4.678462061925825,
-  "global_step": 55000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -1106,11 +1106,111 @@
       "eval_samples_per_second": 30.017,
       "eval_steps_per_second": 0.961,
       "step": 55000
     }
   ],
   "max_steps": 1000000,
   "num_train_epochs": 86,
-  "total_flos": 2.530116704751743e+21,
   "trial_name": null,
   "trial_params": null
 }

 {
   "best_metric": null,
   "best_model_checkpoint": null,
+  "epoch": 5.103776794828173,
+  "global_step": 60000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_samples_per_second": 30.017,
       "eval_steps_per_second": 0.961,
       "step": 55000
+    },
+    {
+      "epoch": 4.72,
+      "learning_rate": 9.999999999999999e-06,
+      "loss": 0.411,
+      "step": 55500
+    },
+    {
+      "epoch": 4.76,
+      "learning_rate": 9.999999999999999e-06,
+      "loss": 0.4108,
+      "step": 56000
+    },
+    {
+      "epoch": 4.76,
+      "eval_loss": 0.38048413395881653,
+      "eval_runtime": 27.2288,
+      "eval_samples_per_second": 18.363,
+      "eval_steps_per_second": 0.588,
+      "step": 56000
+    },
+    {
+      "epoch": 4.81,
+      "learning_rate": 9.999999999999999e-06,
+      "loss": 0.4112,
+      "step": 56500
+    },
+    {
+      "epoch": 4.85,
+      "learning_rate": 9.999999999999999e-06,
+      "loss": 0.4098,
+      "step": 57000
+    },
+    {
+      "epoch": 4.85,
+      "eval_loss": 0.3806820809841156,
+      "eval_runtime": 28.3585,
+      "eval_samples_per_second": 17.631,
+      "eval_steps_per_second": 0.564,
+      "step": 57000
+    },
+    {
+      "epoch": 4.89,
+      "learning_rate": 9.999999999999999e-06,
+      "loss": 0.4083,
+      "step": 57500
+    },
+    {
+      "epoch": 4.93,
+      "learning_rate": 9.999999999999999e-06,
+      "loss": 0.4097,
+      "step": 58000
+    },
+    {
+      "epoch": 4.93,
+      "eval_loss": 0.38133466243743896,
+      "eval_runtime": 31.8927,
+      "eval_samples_per_second": 15.678,
+      "eval_steps_per_second": 0.502,
+      "step": 58000
+    },
+    {
+      "epoch": 4.98,
+      "learning_rate": 9.999999999999999e-06,
+      "loss": 0.41,
+      "step": 58500
+    },
+    {
+      "epoch": 5.02,
+      "learning_rate": 9.999999999999999e-06,
+      "loss": 0.4098,
+      "step": 59000
+    },
+    {
+      "epoch": 5.02,
+      "eval_loss": 0.380397766828537,
+      "eval_runtime": 29.3164,
+      "eval_samples_per_second": 17.055,
+      "eval_steps_per_second": 0.546,
+      "step": 59000
+    },
+    {
+      "epoch": 5.06,
+      "learning_rate": 9.999999999999999e-06,
+      "loss": 0.4094,
+      "step": 59500
+    },
+    {
+      "epoch": 5.1,
+      "learning_rate": 9.999999999999999e-06,
+      "loss": 0.4092,
+      "step": 60000
+    },
+    {
+      "epoch": 5.1,
+      "eval_loss": 0.38139721751213074,
+      "eval_runtime": 19.7764,
+      "eval_samples_per_second": 25.283,
+      "eval_steps_per_second": 0.809,
+      "step": 60000
     }
   ],
   "max_steps": 1000000,
   "num_train_epochs": 86,
+  "total_flos": 2.7601170332347956e+21,
   "trial_name": null,
   "trial_params": null
 }

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:f33e96cd5ae96ee1eef3ce16c2a488ea23ed489c465e68987d362841b961f8c8
 size 449471589

 version https://git-lfs.github.com/spec/v1
+oid sha256:18a2bbc1e1a7ffff89dca088c920d657df7faf45dedf18ccd7ee5e4d0208668c
 size 449471589