Training in progress, epoch 3, checkpoint

Files changed (5) hide show

last-checkpoint/model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:fc43f1f6f30c00816063b65c03e668772ed580a36c79f607ef579bba2dd8db78
 size 265562304

 version https://git-lfs.github.com/spec/v1
+oid sha256:0e7a96259c0bec830cf446e8d9c15c86fdf993ca6f6f61168b30532b5b5d386d
 size 265562304

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:f4fde0d7c7011bbd5c0199f08f873c152db42ecdcd6f27c652e5e24bac26ea10
 size 531185466

 version https://git-lfs.github.com/spec/v1
+oid sha256:a3665e53e810c8b45421e8a84c73cdc4c7f3c88aa090230da497b558e3095eff
 size 531185466

last-checkpoint/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:08bbd4c4ebc8f97f97f2d4c841e4ab52108fa5f9e78b69afebd4b79e9615b325
 size 14244

 version https://git-lfs.github.com/spec/v1
+oid sha256:f90ff128c27d64c4453e5bfd8fe43d4d5cff37ef89f18d3416b9ba490469feaf
 size 14244

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:8d043a2a37bdd5cdd02a82d660f38f8a772d11708a4eb885de9704ffb7e5956f
 size 1064

 version https://git-lfs.github.com/spec/v1
+oid sha256:e5e71f76d03c420f8529f202abf6f45411f0b5c0d2b007f282fb230f1219104b
 size 1064

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,9 +1,9 @@
 {
-  "best_metric": 0.058028511703014374,
-  "best_model_checkpoint": "BERT_NER/checkpoint-900",
-  "epoch": 2.0,
   "eval_steps": 500,
-  "global_step": 900,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -40,6 +40,26 @@
       "eval_samples_per_second": 348.507,
       "eval_steps_per_second": 11.018,
       "step": 900
     }
   ],
   "logging_steps": 500,
@@ -59,7 +79,7 @@
       "attributes": {}
     }
   },
-  "total_flos": 537188712218880.0,
   "train_batch_size": 32,
   "trial_name": null,
   "trial_params": null

 {
+  "best_metric": 0.05421034246683121,
+  "best_model_checkpoint": "BERT_NER/checkpoint-1350",
+  "epoch": 3.0,
   "eval_steps": 500,
+  "global_step": 1350,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_samples_per_second": 348.507,
       "eval_steps_per_second": 11.018,
       "step": 900
+    },
+    {
+      "epoch": 2.2222222222222223,
+      "grad_norm": 0.3950139284133911,
+      "learning_rate": 9.698463103929542e-06,
+      "loss": 0.0658,
+      "step": 1000
+    },
+    {
+      "epoch": 3.0,
+      "eval_accuracy": 0.9854042979557044,
+      "eval_f1": 0.8594994633071578,
+      "eval_loss": 0.05421034246683121,
+      "eval_model_preparation_time": 0.0016,
+      "eval_precision": 0.8481436057531497,
+      "eval_recall": 0.8711635364177737,
+      "eval_runtime": 7.742,
+      "eval_samples_per_second": 265.565,
+      "eval_steps_per_second": 8.396,
+      "step": 1350
     }
   ],
   "logging_steps": 500,
       "attributes": {}
     }
   },
+  "total_flos": 805752940538112.0,
   "train_batch_size": 32,
   "trial_name": null,
   "trial_params": null