Training in progress, step 500, checkpoint

Files changed (5) hide show

checkpoint-500/model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:38f39a27b8dbc50e60f39724f6898bd571d4fd003bc1dfcf60d757e83a383382
 size 435544704

 version https://git-lfs.github.com/spec/v1
+oid sha256:abcc0350254fa842e08bfb0ef7ef4d28280d8ec058c7b2fcd7212778fb144135
 size 435544704

checkpoint-500/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a52a8833776804fd3700ec88e7aa1827363dd16ec68dff93a0d37da99a274362
 size 871183627

 version https://git-lfs.github.com/spec/v1
+oid sha256:9d8d298c8d3bf9687050539987a10d733c0dda8eea8f4710553c11b647a53b59
 size 871183627

checkpoint-500/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:bd9f06c48fbdc17dd2ff2080be4b0717cdeb36abe5aee5d5bd734fe86ae61311
 size 14645

 version https://git-lfs.github.com/spec/v1
+oid sha256:353e94aca0f970f319647a076f5784a062702f6e8eec22e07aca243bb1616cc8
 size 14645

checkpoint-500/trainer_state.json CHANGED Viewed

@@ -1,6 +1,6 @@
 {
   "best_global_step": 399,
-  "best_metric": 5.983016014099121,
   "best_model_checkpoint": null,
   "epoch": 1.2531328320802004,
   "eval_steps": 500,
@@ -11,24 +11,24 @@
   "log_history": [
     {
       "epoch": 0.002506265664160401,
-      "grad_norm": 15.276525497436523,
       "learning_rate": 0.0,
-      "loss": 10.3822,
       "step": 1
     },
     {
       "epoch": 1.0,
-      "grad_norm": 1.2039393186569214,
       "learning_rate": 7.960000000000001e-05,
-      "loss": 6.9837,
       "step": 399
     },
     {
       "epoch": 1.0,
-      "eval_loss": 5.983016014099121,
-      "eval_runtime": 15.8842,
-      "eval_samples_per_second": 1611.54,
-      "eval_steps_per_second": 6.296,
       "step": 399
     }
   ],

 {
   "best_global_step": 399,
+  "best_metric": 5.9839253425598145,
   "best_model_checkpoint": null,
   "epoch": 1.2531328320802004,
   "eval_steps": 500,
   "log_history": [
     {
       "epoch": 0.002506265664160401,
+      "grad_norm": 15.287896156311035,
       "learning_rate": 0.0,
+      "loss": 10.3873,
       "step": 1
     },
     {
       "epoch": 1.0,
+      "grad_norm": 1.349755048751831,
       "learning_rate": 7.960000000000001e-05,
+      "loss": 6.9819,
       "step": 399
     },
     {
       "epoch": 1.0,
+      "eval_loss": 5.9839253425598145,
+      "eval_runtime": 40.2685,
+      "eval_samples_per_second": 635.682,
+      "eval_steps_per_second": 2.483,
       "step": 399
     }
   ],

checkpoint-500/training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:e3d99a586d2a38e89becddbee0adce6692398fb4ff8b6a71d5f8e545b03eeef6
 size 5905

 version https://git-lfs.github.com/spec/v1
+oid sha256:c4d8e95126c79934c43d708d7208a8515199b20fd582881a681e358089ed0c56
 size 5905