Training in progress, step 14400, checkpoint

Browse files

Files changed (8) hide show

last-checkpoint/generation_config.json +1 -14
last-checkpoint/model.safetensors +1 -1
last-checkpoint/optimizer.pt +1 -1
last-checkpoint/rng_state.pth +1 -1
last-checkpoint/scaler.pt +1 -1
last-checkpoint/scheduler.pt +1 -1
last-checkpoint/trainer_state.json +43 -6
last-checkpoint/training_args.bin +1 -1

last-checkpoint/generation_config.json CHANGED Viewed

@@ -2,20 +2,7 @@
   "bos_token_id": 50257,
   "decoder_start_token_id": 50258,
   "eos_token_id": 50257,
-  "input_ids": [
-    [
-      1,
-      50272
-    ],
-    [
-      2,
-      50359
-    ],
-    [
-      3,
-      50363
-    ]
-  ],
   "max_length": 448,
   "pad_token_id": 50257,
   "transformers_version": "4.51.3"

   "bos_token_id": 50257,
   "decoder_start_token_id": 50258,
   "eos_token_id": 50257,
+  "input_ids": null,
   "max_length": 448,
   "pad_token_id": 50257,
   "transformers_version": "4.51.3"

last-checkpoint/model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a6474908382e59a55f6f58eb9e8a1dfb400ba67f9e060b54394d3d9825c65397
 size 223144592

 version https://git-lfs.github.com/spec/v1
+oid sha256:35bf3fcc1c9f858d2fcb65a8eba22aa7bb63ba5498692297455d6d86d9337994
 size 223144592

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:b56e5aa710f545d396ab8a4fb1e84701e5259c2306f422c5b32817e13e478657
 size 281574266

 version https://git-lfs.github.com/spec/v1
+oid sha256:e56d4a55f5092b6c7489de4b87e6abc0943f948bc163c2b9161cc1c8e88b4d42
 size 281574266

last-checkpoint/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:74c4ae0c3e15ee2caa30ea9616d12990c4e05b753f8c9c0d32e1be015f990783
 size 14244

 version https://git-lfs.github.com/spec/v1
+oid sha256:8f5fbb8003bf7f1e9e8f97ef16bde9d5de4080b5c976515ae1b0f6faf7bbe4eb
 size 14244

last-checkpoint/scaler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:4d71333dfeb1f494a554f8b1dd8d8c9db489288d59d5598a046c0260cdc9ee50
 size 988

 version https://git-lfs.github.com/spec/v1
+oid sha256:a52823e3638fa04b21398fcbf87da02f0eac04f592a1235c4d092fb21b164c4e
 size 988

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:abe07b4a652f1015b889f0b198bfdab58ce4d9bcdd73e3bf3789ef694f86ddb4
 size 1064

 version https://git-lfs.github.com/spec/v1
+oid sha256:47186133a71797512426e32473dabdda2a97359d282cffbb1393371c158706b3
 size 1064

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -2,9 +2,9 @@
   "best_global_step": 13200,
   "best_metric": 0.20100206307102858,
   "best_model_checkpoint": "./distil-whisper/checkpoint-13200",
-  "epoch": 9.999109210760734,
   "eval_steps": 400,
-  "global_step": 14030,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -1303,12 +1303,49 @@
       "eval_steps_per_second": 0.432,
       "eval_wer": 0.20439139404656645,
       "step": 14000
     }
   ],
   "logging_steps": 100,
-  "max_steps": 14030,
   "num_input_tokens_seen": 0,
-  "num_train_epochs": 10,
   "save_steps": 400,
   "stateful_callbacks": {
     "TrainerControl": {
@@ -1317,12 +1354,12 @@
         "should_evaluate": false,
         "should_log": false,
         "should_save": true,
-        "should_training_stop": true
       },
       "attributes": {}
     }
   },
-  "total_flos": 1.824121583566848e+19,
   "train_batch_size": 8,
   "trial_name": null,
   "trial_params": null

   "best_global_step": 13200,
   "best_metric": 0.20100206307102858,
   "best_model_checkpoint": "./distil-whisper/checkpoint-13200",
+  "epoch": 10.263673614822732,
   "eval_steps": 400,
+  "global_step": 14400,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_steps_per_second": 0.432,
       "eval_wer": 0.20439139404656645,
       "step": 14000
+    },
+    {
+      "epoch": 10.049884197398896,
+      "grad_norm": 27.002792358398438,
+      "learning_rate": 4.1822620016273397e-05,
+      "loss": 1.4666,
+      "step": 14100
+    },
+    {
+      "epoch": 10.121147336540174,
+      "grad_norm": 27.5255069732666,
+      "learning_rate": 4.139437283199863e-05,
+      "loss": 1.58,
+      "step": 14200
+    },
+    {
+      "epoch": 10.192410475681454,
+      "grad_norm": 29.90217399597168,
+      "learning_rate": 4.096612564772387e-05,
+      "loss": 1.7165,
+      "step": 14300
+    },
+    {
+      "epoch": 10.263673614822732,
+      "grad_norm": 35.381736755371094,
+      "learning_rate": 4.05378784634491e-05,
+      "loss": 1.5442,
+      "step": 14400
+    },
+    {
+      "epoch": 10.263673614822732,
+      "eval_loss": 0.09780226647853851,
+      "eval_runtime": 154.9465,
+      "eval_samples_per_second": 3.227,
+      "eval_steps_per_second": 0.407,
+      "eval_wer": 0.20881226053639848,
+      "step": 14400
     }
   ],
   "logging_steps": 100,
+  "max_steps": 23851,
   "num_input_tokens_seen": 0,
+  "num_train_epochs": 17,
   "save_steps": 400,
   "stateful_callbacks": {
     "TrainerControl": {
         "should_evaluate": false,
         "should_log": false,
         "should_save": true,
+        "should_training_stop": false
       },
       "attributes": {}
     }
   },
+  "total_flos": 1.872251976941568e+19,
   "train_batch_size": 8,
   "trial_name": null,
   "trial_params": null

last-checkpoint/training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:462e4a045e11eb2077809a847cebf70b504a41032f894003cf260b6028024aae
 size 5496

 version https://git-lfs.github.com/spec/v1
+oid sha256:6daed3ea50dd3d62fb97def45cee67ca4aa97248ce2785363140f3aadf764b61
 size 5496