Training in progress, epoch 25, checkpoint

Files changed (5) hide show

last-checkpoint/model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:e2bf762a1c693117661a2e6b5acd9ba79de90c623d4bbf4b865e56acdcdda157
 size 598442860

 version https://git-lfs.github.com/spec/v1
+oid sha256:8ed6fbe9e5f81481d7ad0e28de538ea1d4177a00559bac467dd3b2767b2b3a60
 size 598442860

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:207a6393b2e42b1dd59e4c718a34f25d22c300d23a0e6f1db931caddef4b10c3
 size 1196973562

 version https://git-lfs.github.com/spec/v1
+oid sha256:e91d783e53fac52c0c7c00b574d0f3a9d268c3fb6d233fcdf8ef3ad4d63c3301
 size 1196973562

last-checkpoint/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:618ef55f6c5423457249c94a2577645800716eebc494bf2745faa205a24bad51
 size 14244

 version https://git-lfs.github.com/spec/v1
+oid sha256:bbd76872ac027eb39a9adfefe0495752f0bdba7a48edaf28359209de94e3e648
 size 14244

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:0d4a23bf331c10255c622291f489aea6f2f24812a9bd3d5febfd9dade1a88b34
 size 1064

 version https://git-lfs.github.com/spec/v1
+oid sha256:564cda1e99f8575aecab2238168ab407333f1f142c6fcaa2336965d9be1b83fb
 size 1064

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,9 +1,9 @@
 {
   "best_metric": 0.685027729264332,
   "best_model_checkpoint": "modernbert-medical-classifier/checkpoint-2024",
-  "epoch": 24.0,
   "eval_steps": 500,
-  "global_step": 2208,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -377,6 +377,22 @@
       "eval_samples_per_second": 12.462,
       "eval_steps_per_second": 3.116,
       "step": 2208
     }
   ],
   "logging_steps": 100,
@@ -391,12 +407,12 @@
         "should_evaluate": false,
         "should_log": false,
         "should_save": true,
-        "should_training_stop": false
       },
       "attributes": {}
     }
   },
-  "total_flos": 1.5158504894832e+16,
   "train_batch_size": 4,
   "trial_name": null,
   "trial_params": null

 {
   "best_metric": 0.685027729264332,
   "best_model_checkpoint": "modernbert-medical-classifier/checkpoint-2024",
+  "epoch": 25.0,
   "eval_steps": 500,
+  "global_step": 2300,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_samples_per_second": 12.462,
       "eval_steps_per_second": 3.116,
       "step": 2208
+    },
+    {
+      "epoch": 25.0,
+      "grad_norm": 6.634181318077026e-06,
+      "learning_rate": 0.0,
+      "loss": 0.0,
+      "step": 2300
+    },
+    {
+      "epoch": 25.0,
+      "eval_f1": 0.6675544814093237,
+      "eval_loss": 3.65128493309021,
+      "eval_runtime": 7.4088,
+      "eval_samples_per_second": 12.418,
+      "eval_steps_per_second": 3.104,
+      "step": 2300
     }
   ],
   "logging_steps": 100,
         "should_evaluate": false,
         "should_log": false,
         "should_save": true,
+        "should_training_stop": true
       },
       "attributes": {}
     }
   },
+  "total_flos": 1.579010926545e+16,
   "train_batch_size": 4,
   "trial_name": null,
   "trial_params": null