Training in progress, step 3000, checkpoint

Browse files

Files changed (6) hide show

last-checkpoint/model.safetensors +1 -1
last-checkpoint/optimizer.pt +1 -1
last-checkpoint/rng_state.pth +1 -1
last-checkpoint/scaler.pt +1 -1
last-checkpoint/scheduler.pt +1 -1
last-checkpoint/trainer_state.json +68 -3

last-checkpoint/model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:2029391cdc6b46f4bce12fa986e429f088e4ca217b00c752919f09b25d1aa4bb
 size 430972780

 version https://git-lfs.github.com/spec/v1
+oid sha256:c93dea5672a94e182e4397e46e957256dd9b846289709ace4f8f52f5cb1f6261
 size 430972780

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:30a6e4c391f19b7ce4a9247653997956b7791e634e3e7d6e4b83d1aaf8b9d735
 size 862068555

 version https://git-lfs.github.com/spec/v1
+oid sha256:0a52b46121dff2f3989693cb1f9371359b95edfcc49e5b52a31f52e221461dca
 size 862068555

last-checkpoint/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:e58b7b99958a5f50469af7b1d06bb70e5e8e003683247f5979cf608a8c999b4b
 size 14645

 version https://git-lfs.github.com/spec/v1
+oid sha256:f52cdf95e913ec93635df4b53ed0a27c36d33386e0ffa4a498c6b323ccd609a1
 size 14645

last-checkpoint/scaler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:51009c0139f68650982f878b1fe583aaec3addccf6a83da1e1088ec01a295e18
 size 1383

 version https://git-lfs.github.com/spec/v1
+oid sha256:226d41de2cc700f20b8b0f77d5bec21bf9dbf120fa3828c7b922257be8a4302f
 size 1383

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:358d68264cb066817a0cd8c719c28d96b7ac27147c3224998b457ffec6474d88
 size 1465

 version https://git-lfs.github.com/spec/v1
+oid sha256:3d646e14b9059ed374c0eac5b08f32a92dbd61dc812669511b3d88fa44a1ae0c
 size 1465

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -2,9 +2,9 @@
   "best_global_step": 2700,
   "best_metric": 0.9454253611556982,
   "best_model_checkpoint": "/content/drive/MyDrive/my_works/Work/CSA/models/comparison/ClinicalBERT/checkpoints/checkpoint-2700",
-  "epoch": 1.5959207803724504,
   "eval_steps": 300,
-  "global_step": 2700,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -593,6 +593,71 @@
       "eval_samples_per_second": 529.051,
       "eval_steps_per_second": 16.548,
       "step": 2700
     }
   ],
   "logging_steps": 50,
@@ -612,7 +677,7 @@
       "attributes": {}
     }
   },
-  "total_flos": 5643840120381696.0,
   "train_batch_size": 16,
   "trial_name": null,
   "trial_params": null

   "best_global_step": 2700,
   "best_metric": 0.9454253611556982,
   "best_model_checkpoint": "/content/drive/MyDrive/my_works/Work/CSA/models/comparison/ClinicalBERT/checkpoints/checkpoint-2700",
+  "epoch": 1.7732781554832988,
   "eval_steps": 300,
+  "global_step": 3000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_samples_per_second": 529.051,
       "eval_steps_per_second": 16.548,
       "step": 2700
+    },
+    {
+      "epoch": 1.6254803428909252,
+      "grad_norm": 0.04367101565003395,
+      "learning_rate": 2.070393698648836e-06,
+      "loss": 0.005545063018798828,
+      "step": 2750
+    },
+    {
+      "epoch": 1.6550399054093998,
+      "grad_norm": 0.1608746349811554,
+      "learning_rate": 1.7667815410260181e-06,
+      "loss": 0.00613764226436615,
+      "step": 2800
+    },
+    {
+      "epoch": 1.6845994679278746,
+      "grad_norm": 0.037590060383081436,
+      "learning_rate": 1.4850741428268244e-06,
+      "loss": 0.0038146468997001647,
+      "step": 2850
+    },
+    {
+      "epoch": 1.7141590304463494,
+      "grad_norm": 0.06141559034585953,
+      "learning_rate": 1.2260209962232628e-06,
+      "loss": 0.005997980237007141,
+      "step": 2900
+    },
+    {
+      "epoch": 1.7437185929648242,
+      "grad_norm": 0.04523707181215286,
+      "learning_rate": 9.903113209758098e-07,
+      "loss": 0.00510674774646759,
+      "step": 2950
+    },
+    {
+      "epoch": 1.7732781554832988,
+      "grad_norm": 8.224442481994629,
+      "learning_rate": 7.785722307406685e-07,
+      "loss": 0.004304350912570953,
+      "step": 3000
+    },
+    {
+      "epoch": 1.7732781554832988,
+      "eval_f1_ACCOUNT": 0.97,
+      "eval_f1_AGE_OVER_89": 0.99,
+      "eval_f1_DATE": 0.82,
+      "eval_f1_DEVICE_ID": 0.99,
+      "eval_f1_EMAIL": 0.99,
+      "eval_f1_LOCATION": 0.9,
+      "eval_f1_MRN": 0.96,
+      "eval_f1_NAME": 0.94,
+      "eval_f1_PHONE": 0.93,
+      "eval_f1_SSN": 1.0,
+      "eval_f1_URL": 1.0,
+      "eval_f1_macro": 0.943275291101378,
+      "eval_f1_weighted": 0.943275291101378,
+      "eval_loss": 0.001783758751116693,
+      "eval_precision": 0.9123785906178963,
+      "eval_recall": 0.9763379035824856,
+      "eval_runtime": 11.95,
+      "eval_samples_per_second": 551.129,
+      "eval_steps_per_second": 17.238,
+      "step": 3000
     }
   ],
   "logging_steps": 50,
       "attributes": {}
     }
   },
+  "total_flos": 6271071399895296.0,
   "train_batch_size": 16,
   "trial_name": null,
   "trial_params": null