Training in progress, step 450, checkpoint

Browse files

Files changed (6) hide show

last-checkpoint/adapter_model.safetensors +1 -1
last-checkpoint/optimizer.pt +1 -1
last-checkpoint/rng_state.pth +1 -1
last-checkpoint/scaler.pt +1 -1
last-checkpoint/scheduler.pt +1 -1
last-checkpoint/trainer_state.json +55 -3

last-checkpoint/adapter_model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:2e13aeadadcb18ccca3990a5ea046ad853d02f3507e924d3e926423422b9724f
 size 731354744

 version https://git-lfs.github.com/spec/v1
+oid sha256:3eadd3d4eaf8e8cca40ccfcdf2e7e8c317298579e4396633a91d3ee0c34bdd05
 size 731354744

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:b2f9470edf00755a751f98de8c88e303ee2727803762be95e73a952d310cb559
 size 63408995

 version https://git-lfs.github.com/spec/v1
+oid sha256:f394d21ae96d51c3003b350f67f08fd6b890f4a5aed87fa1ad54d05089da21e9
 size 63408995

last-checkpoint/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:55ea6e86605f5bdbd3d2670e361e09f3a420c9ea42b3ec5fedc3dc6fe8a71f9f
 size 14645

 version https://git-lfs.github.com/spec/v1
+oid sha256:eb704cb6af3d7d6343b8a939e6a99a7d5bc9718dc6aef63d92b013125b539e8a
 size 14645

last-checkpoint/scaler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:2b8c59142c671cf2cf56a62db55635521ca84aea1b7e2c066062e1f4726a4090
 size 1383

 version https://git-lfs.github.com/spec/v1
+oid sha256:75d188a721aa835b9489f9988a78c4834dfa093c6501e89534b2b37f1089e3c2
 size 1383

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:8eb257dcc0502678a900ea37d077b117e01470f20d05ddfe2d784926affdb6db
 size 1465

 version https://git-lfs.github.com/spec/v1
+oid sha256:9a7a8730b38600022e9cc851fea0cc8fd28f0a9a328859865df47989c36fd5de
 size 1465

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -2,9 +2,9 @@
   "best_global_step": 150,
   "best_metric": 1.0783365570599612,
   "best_model_checkpoint": "./whisper-transcription-test-2\\checkpoint-150",
-  "epoch": 1.0101010101010102,
   "eval_steps": 150,
-  "global_step": 300,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -112,6 +112,58 @@
       "eval_steps_per_second": 0.015,
       "eval_wer": 1.2195357833655707,
       "step": 300
     }
   ],
   "logging_steps": 25,
@@ -131,7 +183,7 @@
       "attributes": {}
     }
   },
-  "total_flos": 3.2905894035456e+19,
   "train_batch_size": 8,
   "trial_name": null,
   "trial_params": null

   "best_global_step": 150,
   "best_metric": 1.0783365570599612,
   "best_model_checkpoint": "./whisper-transcription-test-2\\checkpoint-150",
+  "epoch": 1.5151515151515151,
   "eval_steps": 150,
+  "global_step": 450,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_steps_per_second": 0.015,
       "eval_wer": 1.2195357833655707,
       "step": 300
+    },
+    {
+      "epoch": 1.0942760942760943,
+      "grad_norm": 1.3164455890655518,
+      "learning_rate": 9.997482711915926e-06,
+      "loss": 7.9224,
+      "step": 325
+    },
+    {
+      "epoch": 1.1784511784511784,
+      "grad_norm": 2.3813953399658203,
+      "learning_rate": 9.990665021116475e-06,
+      "loss": 7.8599,
+      "step": 350
+    },
+    {
+      "epoch": 1.2626262626262625,
+      "grad_norm": 1.4914205074310303,
+      "learning_rate": 9.979538999730047e-06,
+      "loss": 7.7867,
+      "step": 375
+    },
+    {
+      "epoch": 1.3468013468013469,
+      "grad_norm": 0.9378845691680908,
+      "learning_rate": 9.964114252604508e-06,
+      "loss": 7.7853,
+      "step": 400
+    },
+    {
+      "epoch": 1.430976430976431,
+      "grad_norm": 1.8846515417099,
+      "learning_rate": 9.944404095582444e-06,
+      "loss": 7.7433,
+      "step": 425
+    },
+    {
+      "epoch": 1.5151515151515151,
+      "grad_norm": 1.9767364263534546,
+      "learning_rate": 9.920425544005902e-06,
+      "loss": 7.7287,
+      "step": 450
+    },
+    {
+      "epoch": 1.5151515151515151,
+      "eval_cer": 1.0391868512110727,
+      "eval_loss": 7.759721755981445,
+      "eval_runtime": 4160.7601,
+      "eval_samples_per_second": 0.048,
+      "eval_steps_per_second": 0.012,
+      "eval_wer": 1.4598646034816247,
+      "step": 450
     }
   ],
   "logging_steps": 25,
       "attributes": {}
     }
   },
+  "total_flos": 4.9358841053184e+19,
   "train_batch_size": 8,
   "trial_name": null,
   "trial_params": null