Training in progress, epoch 3, checkpoint

Files changed (5) hide show

last-checkpoint/model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:67dbb13c1700a23a3cd944e85aebc73b962d3f76d94eb4a52c140ccaf7361dc6
 size 1324830880

 version https://git-lfs.github.com/spec/v1
+oid sha256:aa7f89e99a450ce748bcd5fa73e058fb60ddae4d1ec2e538d0dac52525ce0c6b
 size 1324830880

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a8165032ea424772ac69fdaacaaaa571681c1d2179d8967aaf7946a8d90faaab
 size 2649896030

 version https://git-lfs.github.com/spec/v1
+oid sha256:d1db75657c647a9527e5e149a0de8f73a90e243a0696776e3a6f20371509c905
 size 2649896030

last-checkpoint/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:010a2984d2c14ea7f828d2ed740e96d06dd0386afc32f424d17a7b98c9383d42
 size 14244

 version https://git-lfs.github.com/spec/v1
+oid sha256:73cd336dbfdad89399bec06133db2c08a18807b2944b35f34c3ce633cafc07c1
 size 14244

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:eb5fb5e686bee457697966152ad172eba58d6c49cee8cb273e14d35ebb08713f
 size 1064

 version https://git-lfs.github.com/spec/v1
+oid sha256:cc7789bd524a50ae91576dd3944cbc7b88e44f5f7d025656e2190fd21374ec1e
 size 1064

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,9 +1,9 @@
 {
   "best_metric": 6.1056413650512695,
   "best_model_checkpoint": "./opt_trained1/checkpoint-201",
-  "epoch": 2.9956656346749226,
   "eval_steps": 500,
-  "global_step": 603,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -38,6 +38,14 @@
       "eval_samples_per_second": 13.817,
       "eval_steps_per_second": 1.733,
       "step": 603
     }
   ],
   "logging_steps": 500,
@@ -57,7 +65,7 @@
       "attributes": {}
     }
   },
-  "total_flos": 4.085221795489382e+16,
   "train_batch_size": 12,
   "trial_name": null,
   "trial_params": null

 {
   "best_metric": 6.1056413650512695,
   "best_model_checkpoint": "./opt_trained1/checkpoint-201",
+  "epoch": 3.9956656346749226,
   "eval_steps": 500,
+  "global_step": 804,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_samples_per_second": 13.817,
       "eval_steps_per_second": 1.733,
       "step": 603
+    },
+    {
+      "epoch": 3.9956656346749226,
+      "eval_loss": 8.359700202941895,
+      "eval_runtime": 155.7968,
+      "eval_samples_per_second": 13.819,
+      "eval_steps_per_second": 1.733,
+      "step": 804
     }
   ],
   "logging_steps": 500,
       "attributes": {}
     }
   },
+  "total_flos": 5.446962393985843e+16,
   "train_batch_size": 12,
   "trial_name": null,
   "trial_params": null