Training in progress, epoch 5, checkpoint

Files changed (5) hide show

last-checkpoint/model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:1e455806a65a8cd457de9aa3633ac12ea9ac63a33d03abe081a06d16a7e15279
 size 500979600

 version https://git-lfs.github.com/spec/v1
+oid sha256:083b04407fd15fb51b765fd0582cd56fd518d7f8ff8b0233f2e4f0ac48fc9ebb
 size 500979600

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:28ba346e49cb7072768af3efbad839cff457c7c82964980ad88e972cedf5b94f
 size 1002078330

 version https://git-lfs.github.com/spec/v1
+oid sha256:2510e2fa7fa1d955397b34cbb7c26285c975a1bcbc0b125f763ec572fa45e545
 size 1002078330

last-checkpoint/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:cf08d9aba6af994094784f693681fe8e70a1cebc4dd57db2b3c0b7832ef9befc
 size 14244

 version https://git-lfs.github.com/spec/v1
+oid sha256:3777b3c6a0fa94be51a89ad5a8c3cb7b6b136acc79e9c81f0ff9a820338ceb26
 size 14244

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:67270b189be36e5b1860a3a4562dcdaacfb813ecd7c15717e53cb5f48060b566
 size 1064

 version https://git-lfs.github.com/spec/v1
+oid sha256:b854623af9d18b24ea9409e13bcaf50b1828dd5c83def071277f73f4a36ca466
 size 1064

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,9 +1,9 @@
 {
-  "best_metric": 1.3830264806747437,
-  "best_model_checkpoint": "./opt_trained/checkpoint-88",
-  "epoch": 4.0,
   "eval_steps": 500,
-  "global_step": 88,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -39,6 +39,14 @@
       "eval_samples_per_second": 37.2,
       "eval_steps_per_second": 9.3,
       "step": 88
     }
   ],
   "logging_steps": 500,
@@ -58,7 +66,7 @@
       "attributes": {}
     }
   },
-  "total_flos": 2837680459776000.0,
   "train_batch_size": 16,
   "trial_name": null,
   "trial_params": null

 {
+  "best_metric": 1.354698896408081,
+  "best_model_checkpoint": "./opt_trained/checkpoint-110",
+  "epoch": 5.0,
   "eval_steps": 500,
+  "global_step": 110,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_samples_per_second": 37.2,
       "eval_steps_per_second": 9.3,
       "step": 88
+    },
+    {
+      "epoch": 5.0,
+      "eval_loss": 1.354698896408081,
+      "eval_runtime": 8.0581,
+      "eval_samples_per_second": 37.23,
+      "eval_steps_per_second": 9.307,
+      "step": 110
     }
   ],
   "logging_steps": 500,
       "attributes": {}
     }
   },
+  "total_flos": 3547100574720000.0,
   "train_batch_size": 16,
   "trial_name": null,
   "trial_params": null