Training in progress, step 80000

Browse files

Files changed (7) hide show

last-checkpoint/optimizer.pt +1 -1
last-checkpoint/pytorch_model.bin +1 -1
last-checkpoint/rng_state.pth +1 -1
last-checkpoint/scaler.pt +1 -1
last-checkpoint/scheduler.pt +1 -1
last-checkpoint/trainer_state.json +103 -3
pytorch_model.bin +1 -1

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:94c42a01b552543e62a3944c3187b9f2d5e5e9bc4078dc1a017356ad2f7dc004
 size 893439185

 version https://git-lfs.github.com/spec/v1
+oid sha256:7ddeabb9ead685c5e5b416b4a981e11a787d94773db5c89384835f8ea6b2e1c4
 size 893439185

last-checkpoint/pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:9ad209d089c4737fe935a630c9bedf910da9516f82f0d1d863ad0c840e926ffa
 size 449471589

 version https://git-lfs.github.com/spec/v1
+oid sha256:98dacb4579cc2ad8d273f8bac5c3977b66490dafa2ef002d312807df6670d4cd
 size 449471589

last-checkpoint/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:19a6bae5be3d123d40565035db3477df4ba95d519abfda9013e7b522c94cbc53
 size 15523

 version https://git-lfs.github.com/spec/v1
+oid sha256:79b99893c9b02fa371856f47a0ec288962436c435769873b9db7532898348d23
 size 15523

last-checkpoint/scaler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:134046d1fefbeeafed77a6a1deaac9436322f5bf920a26c3d8ece634cccfe3e9
 size 559

 version https://git-lfs.github.com/spec/v1
+oid sha256:56e8d48d0939e6a173efa67076df748028040c8480b0133ac53f27544c88363a
 size 559

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:be8308decf673b01fae26328e1125d69008a8fd59ea958321bb3e87e2ca217de
 size 623

 version https://git-lfs.github.com/spec/v1
+oid sha256:71d5e106c9d23676ccfa26cba844ba11ee123c667bd6da5c807ecc94bb13e886
 size 623

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
   "best_metric": null,
   "best_model_checkpoint": null,
-  "epoch": 6.379720993535216,
-  "global_step": 75000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -1506,11 +1506,111 @@
       "eval_samples_per_second": 21.395,
       "eval_steps_per_second": 0.685,
       "step": 75000
     }
   ],
   "max_steps": 1000000,
   "num_train_epochs": 86,
-  "total_flos": 3.450150330523429e+21,
   "trial_name": null,
   "trial_params": null
 }

 {
   "best_metric": null,
   "best_model_checkpoint": null,
+  "epoch": 6.805035726437564,
+  "global_step": 80000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_samples_per_second": 21.395,
       "eval_steps_per_second": 0.685,
       "step": 75000
+    },
+    {
+      "epoch": 6.42,
+      "learning_rate": 9.999999999999999e-06,
+      "loss": 0.406,
+      "step": 75500
+    },
+    {
+      "epoch": 6.46,
+      "learning_rate": 9.999999999999999e-06,
+      "loss": 0.4054,
+      "step": 76000
+    },
+    {
+      "epoch": 6.46,
+      "eval_loss": 0.3762701749801636,
+      "eval_runtime": 15.2662,
+      "eval_samples_per_second": 32.752,
+      "eval_steps_per_second": 1.048,
+      "step": 76000
+    },
+    {
+      "epoch": 6.51,
+      "learning_rate": 9.999999999999999e-06,
+      "loss": 0.4047,
+      "step": 76500
+    },
+    {
+      "epoch": 6.55,
+      "learning_rate": 9.999999999999999e-06,
+      "loss": 0.4043,
+      "step": 77000
+    },
+    {
+      "epoch": 6.55,
+      "eval_loss": 0.3773665130138397,
+      "eval_runtime": 23.0339,
+      "eval_samples_per_second": 21.707,
+      "eval_steps_per_second": 0.695,
+      "step": 77000
+    },
+    {
+      "epoch": 6.59,
+      "learning_rate": 9.999999999999999e-06,
+      "loss": 0.4041,
+      "step": 77500
+    },
+    {
+      "epoch": 6.63,
+      "learning_rate": 9.999999999999999e-06,
+      "loss": 0.4044,
+      "step": 78000
+    },
+    {
+      "epoch": 6.63,
+      "eval_loss": 0.3738757371902466,
+      "eval_runtime": 16.5496,
+      "eval_samples_per_second": 30.212,
+      "eval_steps_per_second": 0.967,
+      "step": 78000
+    },
+    {
+      "epoch": 6.68,
+      "learning_rate": 9.999999999999999e-06,
+      "loss": 0.4038,
+      "step": 78500
+    },
+    {
+      "epoch": 6.72,
+      "learning_rate": 9.999999999999999e-06,
+      "loss": 0.4038,
+      "step": 79000
+    },
+    {
+      "epoch": 6.72,
+      "eval_loss": 0.37452879548072815,
+      "eval_runtime": 16.7684,
+      "eval_samples_per_second": 29.818,
+      "eval_steps_per_second": 0.954,
+      "step": 79000
+    },
+    {
+      "epoch": 6.76,
+      "learning_rate": 9.999999999999999e-06,
+      "loss": 0.4039,
+      "step": 79500
+    },
+    {
+      "epoch": 6.81,
+      "learning_rate": 9.999999999999999e-06,
+      "loss": 0.4045,
+      "step": 80000
+    },
+    {
+      "epoch": 6.81,
+      "eval_loss": 0.3761942684650421,
+      "eval_runtime": 16.6694,
+      "eval_samples_per_second": 29.995,
+      "eval_steps_per_second": 0.96,
+      "step": 80000
     }
   ],
   "max_steps": 1000000,
   "num_train_epochs": 86,
+  "total_flos": 3.680166814926219e+21,
   "trial_name": null,
   "trial_params": null
 }

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:9ad209d089c4737fe935a630c9bedf910da9516f82f0d1d863ad0c840e926ffa
 size 449471589

 version https://git-lfs.github.com/spec/v1
+oid sha256:98dacb4579cc2ad8d273f8bac5c3977b66490dafa2ef002d312807df6670d4cd
 size 449471589