Training in progress, step 20000

Browse files

Files changed (7) hide show

last-checkpoint/optimizer.pt +1 -1
last-checkpoint/pytorch_model.bin +1 -1
last-checkpoint/rng_state.pth +1 -1
last-checkpoint/scaler.pt +1 -1
last-checkpoint/scheduler.pt +1 -1
last-checkpoint/trainer_state.json +103 -3
pytorch_model.bin +1 -1

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:74b1c9f89c10be34ba07b732580d1baf51bcc9628d8b3575e180ec708de685c5
 size 893438545

 version https://git-lfs.github.com/spec/v1
+oid sha256:077c4e17d5d6659383f86009d5ba0492ce1a7fb2300e1f9721574b2a12b23519
 size 893438545

last-checkpoint/pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:ee2ea420baca9d2eefcc8dae7100675a88105c3d9e9c3b79b36e00445ccc4ead
 size 449471589

 version https://git-lfs.github.com/spec/v1
+oid sha256:f93686a66224f35c3db268b2af688ad304cc6ecd7a83f195fac8d19065d16100
 size 449471589

last-checkpoint/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:7226249c7c6eefd4928af13e408fa71684763a62cddcee1deb41b978d9e6dc31
 size 15523

 version https://git-lfs.github.com/spec/v1
+oid sha256:57142c5a60897ef91d5d8c936729fa6ceded5442a5d10db587b6b7e76f18ca4a
 size 15523

last-checkpoint/scaler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a580bf3efb9f384c93dd5a88430e23ca8962352ab2092b0d242ef512ae2fd496
 size 559

 version https://git-lfs.github.com/spec/v1
+oid sha256:87d518c8dc6f08eacade9bd6abba5d643113786a574d03ca28503afbbe7268e3
 size 559

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:b55c5d2c495ac51faf1cace6b3a1c40da89146b1ba80937cb1f531c05bc48c91
 size 623

 version https://git-lfs.github.com/spec/v1
+oid sha256:f6828d085699bdbc936d5bbc612e9724cd129de0bf65d2e3da37a24ed4eacca1
 size 623

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
   "best_metric": null,
   "best_model_checkpoint": null,
-  "epoch": 1.2759441987070432,
-  "global_step": 15000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -306,11 +306,111 @@
       "eval_samples_per_second": 34.081,
       "eval_steps_per_second": 1.091,
       "step": 15000
     }
   ],
   "max_steps": 1000000,
   "num_train_epochs": 86,
-  "total_flos": 6.900332972886334e+20,
   "trial_name": null,
   "trial_params": null
 }

 {
   "best_metric": null,
   "best_model_checkpoint": null,
+  "epoch": 1.701258931609391,
+  "global_step": 20000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_samples_per_second": 34.081,
       "eval_steps_per_second": 1.091,
       "step": 15000
+    },
+    {
+      "epoch": 1.32,
+      "learning_rate": 9.999999999999999e-06,
+      "loss": 0.4358,
+      "step": 15500
+    },
+    {
+      "epoch": 1.36,
+      "learning_rate": 9.999999999999999e-06,
+      "loss": 0.4363,
+      "step": 16000
+    },
+    {
+      "epoch": 1.36,
+      "eval_loss": 0.4048325717449188,
+      "eval_runtime": 16.0756,
+      "eval_samples_per_second": 31.103,
+      "eval_steps_per_second": 0.995,
+      "step": 16000
+    },
+    {
+      "epoch": 1.4,
+      "learning_rate": 9.999999999999999e-06,
+      "loss": 0.4352,
+      "step": 16500
+    },
+    {
+      "epoch": 1.45,
+      "learning_rate": 9.999999999999999e-06,
+      "loss": 0.4346,
+      "step": 17000
+    },
+    {
+      "epoch": 1.45,
+      "eval_loss": 0.4037468731403351,
+      "eval_runtime": 16.4235,
+      "eval_samples_per_second": 30.444,
+      "eval_steps_per_second": 0.974,
+      "step": 17000
+    },
+    {
+      "epoch": 1.49,
+      "learning_rate": 9.999999999999999e-06,
+      "loss": 0.4336,
+      "step": 17500
+    },
+    {
+      "epoch": 1.53,
+      "learning_rate": 9.999999999999999e-06,
+      "loss": 0.4335,
+      "step": 18000
+    },
+    {
+      "epoch": 1.53,
+      "eval_loss": 0.402103453874588,
+      "eval_runtime": 28.6118,
+      "eval_samples_per_second": 17.475,
+      "eval_steps_per_second": 0.559,
+      "step": 18000
+    },
+    {
+      "epoch": 1.57,
+      "learning_rate": 9.999999999999999e-06,
+      "loss": 0.4325,
+      "step": 18500
+    },
+    {
+      "epoch": 1.62,
+      "learning_rate": 9.999999999999999e-06,
+      "loss": 0.4319,
+      "step": 19000
+    },
+    {
+      "epoch": 1.62,
+      "eval_loss": 0.4030299186706543,
+      "eval_runtime": 16.452,
+      "eval_samples_per_second": 30.391,
+      "eval_steps_per_second": 0.973,
+      "step": 19000
+    },
+    {
+      "epoch": 1.66,
+      "learning_rate": 9.999999999999999e-06,
+      "loss": 0.4311,
+      "step": 19500
+    },
+    {
+      "epoch": 1.7,
+      "learning_rate": 9.999999999999999e-06,
+      "loss": 0.4317,
+      "step": 20000
+    },
+    {
+      "epoch": 1.7,
+      "eval_loss": 0.40188169479370117,
+      "eval_runtime": 15.416,
+      "eval_samples_per_second": 32.434,
+      "eval_steps_per_second": 1.038,
+      "step": 20000
     }
   ],
   "max_steps": 1000000,
   "num_train_epochs": 86,
+  "total_flos": 9.200497816914238e+20,
   "trial_name": null,
   "trial_params": null
 }

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:ee2ea420baca9d2eefcc8dae7100675a88105c3d9e9c3b79b36e00445ccc4ead
 size 449471589

 version https://git-lfs.github.com/spec/v1
+oid sha256:f93686a66224f35c3db268b2af688ad304cc6ecd7a83f195fac8d19065d16100
 size 449471589